Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Credit scoring w praktyce z wykorzystaniem R

Szkolenie przedstawia kompletny proces budowy systemu scoringowego: od zebrania danych, poprzez wybór cech i wyznaczenie punktów scoringowych, aż do monitorowania działającego systemu. Nową wiedzę utrwalamy ćwicząc z wykorzystaniem systemu R + RCommander. Dyskutujemy także o szczegółach technicznych oraz własnościach teoretycznych przedstawianych metod. Uczestnicy szkolenia otrzymują materiały pozwalające na dalszą samodzielną pracę (skrypty R).

Korzyści

Uczestnicy szkolenia:

  • poznają wszystkie etapy procesu budowy systemu scoringowego,
  • nauczą się przygotowywać dane do budowy modeli scoringowych,
  • poznają metody statystyczne stosowane w budowie kart scoringowych,
  • dowiedzą się, jak radzić sobie z brakiem informacji o wnioskach odrzuconych (reject inference),
  • zapoznają się ze sposobami oceny jakości modeli scoringowych,
  • poznają podstawy R,
  • wszystko przećwiczą w praktyce na komputerze,
  • otrzymają materiały umożliwiające samodzielną późniejszą pracę.

Skrót programu szkolenia

  • Wstęp i krótkie wprowadzenie do R
  • Przegląd etapów kompletnego procesu budowy systemu scoringowego
  • Analiza i przekształcenia cech do budowy systemu scoringowego
  • Regresja logistyczna: podstawy teoretyczne i praktyka
  • Metody wyboru cech do budowy modelu
  • Sposoby oceny jakości systemu scoringowego
  • Uwzględnienie wniosków odrzuconych (reject inference)
  • Wykorzystywanie systemu scoringowego w praktyce

Pełny program szkolenia poniżej.

Uczestnicy

Pracownicy departamentów ryzyka kredytowego, audytu, IT:

  • budujący modele scoringowe lub zamierzający budować modele scoringowe,
  • monitorujący działanie modeli scoringowych,
  • walidujący modele scoringowe,
  • analitycy ryzyka kredytowego,
  • wszyscy zainteresowani poznaniem sposobów budowy systemów scoringowych i zrozumieniem ich działania.

Więcej informacji

Program szkolenia i program szkolenia w pdf (55 KB).

Terminy szkoleń otwartych.

Rejestracja na szkolenie otwarte.

Szkolenie dostępne jest także jako zamknięte. Zakres i termin dostosowane będą do Państwa potrzeb. Jeśli są Państwo zainteresowani szkoleniem zamkniętym, to proszę o kontakt.

Program szkolenia

Przeczytaj program szkolenia w pdf (55 KB).

  1. Krótkie wprowadzenie do R
    • wprowadzenie do środowiska R
      • specyfika i przegląd możliwości systemu
      • instalacja i konfiguracja
      • użytkowanie R
      • system pomocy
      • graficzny interfejs użytkownika
      • korzystanie z wbudowanych funkcji
    • R od podstaw: typy i struktury danych
      • typy zmiennych
      • obiekty i ich podstawowe własności (wektory, macierze, zmienne tekstowe, listy i ramki danych)
      • podstawowe operacje na obiektach
    • elementy programowania w R
      • podstawy języka R
      • instrukcje sterujące przepływem kodu
      • tworzenie własnych skryptów i funkcji
  2. Wstęp
    • ocena ryzyka kredytowego przed powstaniem systemów scoringowych
    • zalety i obszary stosowania systemów scoringowych
    • idea działania: wykorzystanie danych historycznych do przewidywania przyszłego zachowania
    • zalety i wady punktowej oceny ryzyka
    • korzyści wynikające z zastosowania systemów scoringowych
    • rodzaje systemów scoringowych
      • podział ze względu na zastosowanie
      • podział ze względu na sposób budowy
      • łączenie różnych rodzajów scoringu
  3. Przegląd etapów kompletnego procesu budowy systemu scoringowego
    • organizacja projektu (w tym definicja celu biznesowego dla systemu scoringowego)
    • wstępna analiza danych
    • definicja parametrów
      • definicja dobrego i złego klienta: przekształcenie celu biznesowego na cel statystyczny
      • application window i performance window
      • wykluczenia
      • segmentacja
    • przygotowanie danych
      • cechy stosowane w scoringu
      • wybór próby konstrukcyjnej
      • zgromadzenie i oczyszczenie danych
    • budowa karty scoringowej w skrócie
      • analiza i przekształcenia cech do budowy systemu scoringowego
      • regresja logistyczna: podstawy teoretyczne i praktyka
      • metody wyboru cech do budowy modelu
      • sposoby oceny jakości systemu scoringowego
      • uwzględnienie wniosków odrzuconych (reject inference)
    • wykorzystywanie systemu scoringowego w praktyce
      • raporty podsumowujące proces budowy karty scoringowej
      • wdrożenie karty (w tym dobór punktu odcięcia: iso-risk, iso-acceptance)
      • monitorowanie karty
  4. Analiza i przekształcenia cech do budowy systemu scoringowego
    • analiza pojedynczych cech
      • Weight of Evidence, odds
      • rozkłady cech (tablice kontyngencji, histogramy)
      • obserwacje brakujące oraz obserwacje odstające
      • kontrola jakości i czyszczenie danych
      • wstępny wybór cech do konstrukcji modelu – analiza zdolności dyskryminacyjnej cech
    • przedziałowanie zmiennych ciągłych (fine classing i coarse classing)
      • rola przedziałowania
      • przedziałowanie metodą weight of evidence (WoE)
    • analiza zależności między cechami i konstrukcja cech pochodnych (generated characteristics, cross characteristics)
  5. Regresja logistyczna: podstawy teoretyczne i praktyka
    • wprowadzenie do regresji logistycznej
      • zalety regresji logistycznej
      • modele regresyjne – wprowadzenie na przykładzie regresji liniowej
      • czym jest scoring: model liniowy, model logit i probit
    • idea modelu (dummy variables, modele dla zmiennych ciągłych)
    • podstawy statystyczne
    • budowa modelu, własności praktyczne i teoretyczne
    • dwa podejścia do budowy systemów scoringowych metodą regresji logistycznej
    • interpretacja wyników
    • diagnostyka modelu: testy statystyczne i wykresy
    • wnioskowanie statystyczne dla regresji logistycznej
    • inne metody budowy systemów scoringowych oraz ich wady i zalety
  6. Metody wyboru cech do budowy modelu
    • wprowadzenie do oceny jakości modelu
    • kryteria zastosowania cech w scoringu (statystyczne, biznesowe, operacyjne)
    • wartość informacyjna cechy (information value)
    • przegląd zupełny zbioru cech
    • inne sposoby wyboru cech
      • metody forward, backward bazujące na jakości klasyfikacji
      • metody krokowe bazujące na kryterium AIC
  7. Sposoby oceny jakości systemu scoringowego
    • kryteria dobroci dopasowania modelu (AIC, R^2)
    • analiza zdolności predykcyjnej modelu
    • rozkłady punktów scoringowych
    • ocena jakości klasyfikacji: confusion matrix
    • ocena zdolności dyskryminacyjnej: krzywa ROC, miary AR, KS i dywergencja
  8. Uwzględnienie wniosków odrzuconych (reject inference)
    • idea reject inference
    • przegląd metod reject inference
      • define as bad
      • extrapolation
      • augmentation
  9. Wykorzystywanie systemu scoringowego w praktyce
    • dobór punktu odcięcia
    • wdrożenie systemu scoringowego
    • monitorowanie skuteczności działania systemu i raportowanie
      • monitorowanie siły predykcyjnej systemu
      • monitorowanie siły predykcyjnej cech
      • monitorowanie stabilności populacji
    • strategia champion-challenger


szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław