Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Data mining w praktyce z wykorzystaniem R

Udział w szkoleniu zapewnia zrozumienie metodologii analizy danych metodami data mining, poznanie wybranych metod oraz zdobycie podstawowych praktycznych umiejętności w tej dziedzinie.

Przedstawione będą metody klasyfikacji obiektów (używane w budowie modeli predykcyjnych), metody analizy skupień (tworzenie grup klientów), metody redukcji wymiaru (prezentacja graficzna danych wielowymiarowych) oraz metody odkrywania reguł asocjacyjnych (analiza koszyka zakupów).

Wykłady są ilustrowane przykładami analizy danych rzeczywistych. Po każdej części szkolenia uczestnicy wykonują samodzielnie ćwiczenia praktyczne.

Uczestnicy otrzymują skrypty R ułatwiające późniejszą pracę z własnymi danymi bez konieczności zakupu oprogramowania.

Korzyści

Uczestnicy szkolenia:

  • nauczą się przygotowywać dane do analizy,
  • poznają metody eksploracji danych i budowy modeli,
  • zapoznają się ze sposobami oceny jakości modeli,
  • wszystko przećwiczą w praktyce na komputerze,
  • otrzymają skrypty R umożliwiające samodzielną późniejszą pracę.

Skrót programu szkolenia

  • Wprowadzenie do data miningu i jego zadania
  • Przygotowanie danych do analizy
  • Przegląd metod data miningu
  • Wybrane metody wizualizacji i eksploracyjna analiza danych
  • Wybór najlepszych cech i optymalnego modelu/algorytmu
  • Prowadzenie projektów eksploracji danych
  • Case studies

Pełny program szkolenia poniżej.

Uczestnicy

Pracownicy departamentów zajmujących się analizą danych i modelowaniem (CRM, ryzyko kredytowe), departamentów controllingu, audytu, IT:

  • potrzebujący analizować dane,
  • chcący odkrywać zależności w danych,
  • budujący modele predykcyjne.

Więcej informacji

Program szkolenia i program szkolenia w pdf (55 KB).

Terminy szkoleń otwartych.

Rejestracja na szkolenie otwarte.

Szkolenie dostępne jest także jako zamknięte. Zakres i termin dostosowane będą do Państwa potrzeb. Jeśli są Państwo zainteresowani szkoleniem zamkniętym, to proszę o kontakt.

Program szkolenia

Przeczytaj program szkolenia w pdf (55 KB).

  1. Wprowadzenie do data miningu
    • czym jest data mining (DM)?
    • przegląd zastosowań DM: zastosowania w bankowości i w przemyśle, text mining, web mining
    • data mining z punktu widzenia potrzeb biznesowych firmy: analiza klientów i ich zachowania, CRM, wspomaganie podejmowania decyzji, możliwe korzyści
    • główne etapy w procesie odkrywania wiedzy w danych (Knowledge Discovery in Data)
    • różnice pomiędzy DM, OLAP i analizą wyników zapytań bazodanowych
    • DM a statystyka
  2. Przegląd rodzajów zadań DM
    • klasyfikacja
    • analiza skupień
    • odkrywanie reguł asocjacyjnych
    • redukcja wymiaru
  3. Przygotowanie danych do analiz metodami data mining
    • analiza jakości danych
    • obserwacje brakujące i nietypowe
    • czyszczenie danych
    • przekształcenia wstępne
  4. Przegląd metod stosowanych w DM
    • klasyfikacja metod/algorytmów; uczenie z nadzorem i uczenie bez nadzoru
    • metody klasyfikacji (drzewa klasyfikacyjne, metoda najbliższego sąsiada (k-NN))
    • algorytmy analizy skupień (metoda k-średnich, metody hierarchiczne)
    • techniki redukcji wymiaru (metoda składowych głównych (PCA), skalowanie wielowymiarowe (MDS))
    • metody odkrywania reguł asocjacyjnych (algorytm apriori).
  5. Wybrane metody wizualizacji i eksploracyjna analiza danych (EDA)
    • analiza graficzna jednowymiarowa i wielowymiarowa
    • podstawowe wykresy analizy opisowej
    • zaawansowane algorytmy stosowane w wizualizacji danych wielowymiarowych
    • czym jest EDA?
    • metody stosowane w EDA
  6. Wybór najlepszych cech i optymalnego modelu/algorytmu
    • wybór istotnych cech (atrybutów)
    • ogólne reguły związane z wyborem modelu
    • problem przeuczenia (overfitting)
    • kompromis pomiędzy złożonością struktury modelu, a jego efektywnością
    • ocena efektywności zastosowanej metody/algorytmu
  7. Prowadzenie projektów DM
    • popularne metodologie prowadzenia projektów DM:
    • Virtuous Cycle of Data Mining
    • CRISP-DM
    • wskazówki praktyczne
  8. Case studies
    • przykłady typowych zadań DM na bazie wybranych problemów praktycznych
  9. Dyskusja: możliwe korzyści biznesowe związane z zastosowaniem analiz data mining
    • dyskusja z uczestnikami szkolenia na temat przydatności i możliwości zastosowanie metod data miningu w analizie problemów spotykanych w ich praktyce zawodowej


szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław