Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Statystyka i symulacje w R

Szkolenie obejmuje bardzo szeroki zakres współczesnej statystyki, od wnioskowania statystycznego do metod symulacyjnych.

Każdy dział szkolenia ilustrowany jest ćwiczeniami praktycznymi bazującymi na rzeczywistych danych biznesowych.

Unikatową cechą szkolenia jest to, że ma ono charakter praktyczny, warsztatowy oraz równocześnie bazuje na darmowym oprogramowaniu. Oznacza to, że uczestnicy szkolenia uzyskują przydatne umiejętności praktyczne, a po zakończeniu szkolenia każdy jego uczestnik może analizować własne dane bez konieczności zakupu oprogramowania. Uczestnicy otrzymują skrypty ułatwiające późniejszą pracę z własnymi danymi.

Czas trwania: 1-4 dni

Oprogramowanie: System R + RCommander

Warianty: Szkolenie ma podany bardzo szeroki zakres i powinien być on dostosowany do czasu trwania szkolenia.

Więcej informacji

Program szkolenia i program szkolenia w pdf (55 KB).

Szkolenie dostępne jest wyłącznie jako zamknięte. Zakres i termin dostosowane będą do Państwa potrzeb. Jeśli są Państwo zainteresowani szkoleniem zamkniętym, to proszę o kontakt.

Program szkolenia

Przeczytaj program szkolenia w pdf (55 KB).

  1. Podstawy statystyki – wnioskowanie statystyczne
    • podstawy modeli statystycznych – zmienne losowe i ich rozkłady
    • estymacja punktowa i przedziałowa – cele i zastosowania
    • przegląd metod estymacji (metoda najmniejszych kwadratów, metoda największej wiarygodności, metoda momentów)
    • podstawy weryfikacji hipotez statystycznych
    • związek pomiędzy testowaniem hipotez statystycznych i konstrukcją przedziałów ufności
    • wybrane testy parametryczne i nieparametryczne (testy istotności, zgodności i niezależności)
    • testowanie hipotez statystycznych w praktyce:
      • dobór odpowiedniego testu statystycznego do zagadnienia
      • interpretacja wyników
      • założenia i wymagania testów statystycznych
      • analiza mocy testów
      • dobór liczebności próby
    • weryfikacja hipotez statystycznych na przykładach danych rzeczywistych spotykanych w bankowości i w przemyśle
    • wybrane aspekty planowania eksperymentu
  2. Analiza regresji i korelacji
    • ocena zależności zmiennych ilościowych – podstawowe narzędzia (współczynnik korelacji próbkowej, wykres rozrzutu)
    • wprowadzenie do metod regresyjnych – cele i zastosowania
    • model regresji liniowej – struktura i założenia
    • aspekty praktyczne związane z budową modeli regresyjnych
      • dopasowanie modelu
      • ocena jakości dopasowania modelu (diagnostyka modelu regresji): weryfikacja istotności zmiennych, analiza wartości resztowych
      • interpretacja skonstruowanego modelu
    • porównanie i wybór najlepszego modelu
    • wykorzystanie dopasowanego modelu do prognozowania (prognoza punktowa i przedziałowa)
    • wybór zmiennych do budowy modelu.
    • pozostałe zagadnienia związane z analizą regresji
      • transformacje danych
      • analiza obserwacji odstających i wpływowych
      • analiza współliniowości zmiennych
    • model regresji logistycznej
  3. Metody nieparametryczne statystyki
    • metody parametryczne i nieparametryczne we wnioskowaniu statystycznym
    • potrzeba i cele stosowania metod nieparametrycznych
    • przykłady zastosowań metod nieparametrycznych
      • estymacja gęstości rozkładu
      • estymacja funkcji regresji
      • estymacja funkcji intensywności
      • estymacja funkcji trendu
    • wybrane metody estymacji nieparametrycznej
      • metody jądrowe (kernel smoothing)
      • metody projekcyjne
      • lokalne modele regresyjne (np. metoda loess)
      • funkcje gięte (smoothing splines)
    • metody oparte na replikowaniu danych (m.in.: metody jackknife, bootstrap, subsampling)
    • przykłady praktyczne zastosowań metod nieparametrycznych
  4. Metody symulacyjne i modelowanie stochastyczne
    • porównanie stochastycznego i deterministycznego podejścia do modelowania
    • podstawy modeli stochastycznych – zmienne losowe i ich rozkłady
    • mechanizmy komputerowego generowania liczb pseudolosowych
    • metody symulowania zmiennych losowych o zadanych rozkładach (ciągłych lub dyskretnych)
      • metody dedykowane (np. rozkład normalny, rozkład beta)
      • metody uniwersalne (np. metoda von Neumanna, metoda dystrybuanty odwrotnej)
    • modele stochastyczne
      • łańcuchy Markowa
      • procesy dyfuzyjne (ruch Browna)
      • procesy punktowe (procesy Poissona)
      • modele obsługi masowej (systemy kolejkowe)
    • przykłady praktyczne zastosowań modeli stochastycznych


szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław