Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Praktyczna analiza danych w R

W czasie szkolenia przedstawione zostaną podstawowe metody analizy danych. Każdy dział szkolenia ilustrowany jest ćwiczeniami praktycznymi bazującymi na rzeczywistych danych biznesowych. Dzięki temu uczestnicy szkolenia mają możliwość zdobycia praktycznych umiejętności w zakresie analizy danych oraz zapoznają się z typowymi problemami, które pojawią się podczas pracy z danymi. Zakres szkolenia obejmuje narzędzia analizy opisowej, takie jak wskaźniki sumaryczne oraz wykresy. Przedstawione zostaną także wybrane modele i testy statystyczne. Szczególna uwaga poświęcona będzie analizie korelacji i modelowi regresji liniowej.

Unikatową cechą szkolenia jest to, że ma ono charakter praktyczny, warsztatowy oraz równocześnie bazuje na darmowym oprogramowaniu. Oznacza to, że uczestnicy szkolenia uzyskują przydatne umiejętności praktyczne, a po zakończeniu szkolenia każdy jego uczestnik może analizować własne dane bez konieczności zakupu oprogramowania. Uczestnicy otrzymują skrypty R ułatwiające późniejszą pracę z własnymi danymi.

Czas trwania: 1-2 dni

Oprogramowanie: System R + RCommander

Więcej informacji

Program szkolenia i program szkolenia w pdf (55 KB).

Szkolenie dostępne jest wyłącznie jako zamknięte. Zakres i termin dostosowane będą do Państwa potrzeb. Jeśli są Państwo zainteresowani szkoleniem zamkniętym, to proszę o kontakt.

Program szkolenia

Przeczytaj program szkolenia w pdf (55 KB).

  1. Podstawy praktycznej analizy danych: przygotowanie danych i analiza opisowa
    • rodzaje cech statystycznych – cechy jakościowe i ilościowe
    • przygotowanie danych do analiz (wybór podzbiorów, standaryzacja, proste przekształcenia)
    • grupowanie danych (tablice wielodzielcze, tabele przestawne)
    • analiza opisowa danych – podstawowe wskaźniki i ich własności
    • grafika w analizie opisowej – użyteczne wykresy i ich interpretacja (histogramy, wykresy słupkowe i kołowe, wykres pudełkowy, wykresy rozrzutu i inne)
    • wizualizacja danych kategorycznych
    • problem jakości danych: obserwacje brakujące i nietypowe
    • przykłady analizy opisowej dla danych rzeczywistych
  2. Podstawy statystyki, rozkłady zmiennych losowych oraz próbkowanie danych
    • czym jest statystyka?
    • możliwe cele i rodzaje badań statystycznych
    • etapy w badaniu statystycznym
    • podstawy modeli statystycznych – zmienne losowe dyskretne i ciągłe oraz ich rozkłady.
    • metody doboru próby
  3. Elementy wnioskowania statystycznego
    • podstawy weryfikacji hipotez statystycznych – idea testowania hipotez, zastosowania praktyczne i przegląd najpopularniejszych testów statystycznych (testy istotności, zgodności i niezależności).
    • estymacja parametrów
    • przedziały ufności
    • testowanie hipotez statystycznych dla jednej populacji
    • testowanie hipotez statystycznych dla dwóch populacji
    • sprawdzanie hipotez statystycznych w praktyce
    • przykłady zastosowania metod wnioskowania statystycznego dla danych rzeczywistych
    • analiza wariancji
    • wybrane metody nieparametryczne
  4. Model regresji liniowej
    • analiza zależności dwóch zmiennych ilościowych
    • ocena zależności zmiennych ilościowych: współczynnik korelacji i wykres rozrzutu
    • prosty model regresji liniowej: założenia i ograniczenia modelu, interpretacja
    • dopasowanie i diagnostyka modelu
    • porównanie i wybór najlepszego modelu
    • regresja wielokrotna
    • wybór zmiennych do budowy modelu
    • wykorzystanie dopasowanego modelu do prognozowania
    • praktyczna analiza korelacji i regresji na przykładach danych rzeczywistych


szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław