Praktyczna analiza danych w R
W czasie szkolenia przedstawione zostaną podstawowe metody analizy danych. Każdy dział szkolenia ilustrowany jest ćwiczeniami praktycznymi bazującymi na rzeczywistych danych biznesowych. Dzięki temu uczestnicy szkolenia mają możliwość zdobycia praktycznych umiejętności w zakresie analizy danych oraz zapoznają się z typowymi problemami, które pojawią się podczas pracy z danymi. Zakres szkolenia obejmuje narzędzia analizy opisowej, takie jak wskaźniki sumaryczne oraz wykresy. Przedstawione zostaną także wybrane modele i testy statystyczne. Szczególna uwaga poświęcona będzie analizie korelacji i modelowi regresji liniowej.
Unikatową cechą szkolenia jest to, że ma ono charakter praktyczny, warsztatowy oraz równocześnie bazuje na darmowym oprogramowaniu. Oznacza to, że uczestnicy szkolenia uzyskują przydatne umiejętności praktyczne, a po zakończeniu szkolenia każdy jego uczestnik może analizować własne dane bez konieczności zakupu oprogramowania. Uczestnicy otrzymują skrypty R ułatwiające późniejszą pracę z własnymi danymi.
Czas trwania: 1-2 dni
Oprogramowanie: System R + RCommander
Więcej informacji
Program szkolenia i program szkolenia w pdf (55 KB).
Szkolenie dostępne jest wyłącznie jako zamknięte. Zakres i termin dostosowane będą do Państwa potrzeb. Jeśli są Państwo zainteresowani szkoleniem zamkniętym, to proszę o kontakt.
Program szkolenia
Przeczytaj program szkolenia w pdf (55 KB).
- Podstawy praktycznej analizy danych: przygotowanie danych i analiza opisowa
- rodzaje cech statystycznych – cechy jakościowe i ilościowe
- przygotowanie danych do analiz (wybór podzbiorów, standaryzacja, proste przekształcenia)
- grupowanie danych (tablice wielodzielcze, tabele przestawne)
- analiza opisowa danych – podstawowe wskaźniki i ich własności
- grafika w analizie opisowej – użyteczne wykresy i ich interpretacja (histogramy, wykresy słupkowe i kołowe, wykres pudełkowy, wykresy rozrzutu i inne)
- wizualizacja danych kategorycznych
- problem jakości danych: obserwacje brakujące i nietypowe
- przykłady analizy opisowej dla danych rzeczywistych
- Podstawy statystyki, rozkłady zmiennych losowych oraz próbkowanie danych
- czym jest statystyka?
- możliwe cele i rodzaje badań statystycznych
- etapy w badaniu statystycznym
- podstawy modeli statystycznych – zmienne losowe dyskretne i ciągłe oraz ich rozkłady.
- metody doboru próby
- Elementy wnioskowania statystycznego
- podstawy weryfikacji hipotez statystycznych – idea testowania hipotez, zastosowania praktyczne i przegląd najpopularniejszych testów statystycznych (testy istotności, zgodności i niezależności).
- estymacja parametrów
- przedziały ufności
- testowanie hipotez statystycznych dla jednej populacji
- testowanie hipotez statystycznych dla dwóch populacji
- sprawdzanie hipotez statystycznych w praktyce
- przykłady zastosowania metod wnioskowania statystycznego dla danych rzeczywistych
- analiza wariancji
- wybrane metody nieparametryczne
- Model regresji liniowej
- analiza zależności dwóch zmiennych ilościowych
- ocena zależności zmiennych ilościowych: współczynnik korelacji i wykres rozrzutu
- prosty model regresji liniowej: założenia i ograniczenia modelu, interpretacja
- dopasowanie i diagnostyka modelu
- porównanie i wybór najlepszego modelu
- regresja wielokrotna
- wybór zmiennych do budowy modelu
- wykorzystanie dopasowanego modelu do prognozowania
- praktyczna analiza korelacji i regresji na przykładach danych rzeczywistych
