Plan Szkolenia
Wprowadzenie
- Proces Data Science
- Role i obowiązki analityka danych
Przygotowanie środowiska programistycznego
- Biblioteki, frameworki, języki i narzędzia
- Rozwój lokalny
- Wspólny rozwój oparty na sieci
Gromadzenie danych
- Różne rodzaje danych
- Ustrukturyzowane
- Lokalne bazy danych
- Złącza Database
- Popularne formaty: xlxs, XML, Json, csv, ...
- Niestrukturalne
- Kliknięcia, cenzury, smartfony
- Interfejsy API
- Internet of Things (IoT)
- Dokumenty, zdjęcia, filmy, dźwięki
- Ustrukturyzowane
- Studium przypadku: Ciągłe gromadzenie dużych ilości nieustrukturyzowanych danych
Przechowywanie danych
- Relacyjne bazy danych
- Nierelacyjne bazy danych
- Hadoop: Rozproszony system plików (HDFS)
- Spark: Odporny rozproszony zbiór danych (RDD)
- Przechowywanie danych w chmurze
Przygotowanie danych
- Pozyskiwanie, selekcja, oczyszczanie i przekształcanie danych
- Zapewnienie jakości danych - poprawności, znaczenia i bezpieczeństwa
- Raporty o wyjątkach
Languages używane do przygotowywania, przetwarzania i analizy danych
- Język R
- Wprowadzenie do języka R
- Manipulacja danymi, obliczenia i wyświetlanie graficzne
- Python
- Wprowadzenie do Python
- Manipulowanie, przetwarzanie, czyszczenie i przetwarzanie danych
Analiza danych
- Analiza eksploracyjna
- Podstawowe statystyki
- Wstępne wizualizacje
- Zrozumienie danych
- Przyczynowość
- Funkcje i przekształcenia
- Machine Learning
- Nadzorowane vs nienadzorowane
- Kiedy używać jakiego modelu
- Natural Language Processing (NLP)
Data Visualization
- Najlepsze praktyki
- Wybór odpowiedniego wykresu dla odpowiednich danych
- Palety kolorów
- Przenoszenie na wyższy poziom
- Pulpity nawigacyjne
- Interaktywne wizualizacje
- Opowiadanie historii za pomocą danych
Podsumowanie i wnioski
Wymagania
- Ogólne zrozumienie koncepcji baz danych
- Podstawowe zrozumienie statystyki
Opinie uczestników (4)
Polubiałem styl Pabla, fakt, że poruszył wiele tematów od projektowania raportów i personalizacji za pomocą HTML do implementacji prostych algorytmów uczenia maszynowego. Good równowagi między informacjami teoretycznymi a ćwiczeniami. Pablo naprawdę obejrzał wszystkie tematy, które mnie interesowały i udzielił kompleksowych odpowiedzi na moje pytania.
Cristian Tudose - SC Automobile Dacia SA
Szkolenie - Advanced Data Analysis with TIBCO Spotfire
Przetłumaczone przez sztuczną inteligencję
Aktualne zastosowanie Spotfire i wszystkie podstawowe funkcje.
Michael Capili - STMicroelectronics, Inc.
Szkolenie - Introduction to Spotfire
Przetłumaczone przez sztuczną inteligencję
Wiedza o rzeczywistym świecie od kogoś z branży
Matthew Cerbas - Shield Consulting Solutions, Inc.
Szkolenie - Grafana
Przetłumaczone przez sztuczną inteligencję
Miło mi było brać udział w wielu laboratoriach i ćwiczeniach praktycznych.
Vivian Feng - Destination Canada
Szkolenie - Data Analysis with SQL, Python and Spotfire
Przetłumaczone przez sztuczną inteligencję