Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Blog October, 2008

Oct
28

Analiza ryzyka kredytowego w GNU R: CreditMetrics

Model CreditMetrics (obok CreditRisk+ i KMV) jest jednym z podstawowych podejść do portfelowego modelowania ryzyka kredytowego. Parę lat temu pracowałem nad zastosowaniem podobnych modeli w praktyce bankowej. Wykorzystanie systemu R bardzo ułatwia takie zastosowania.

Pakiet bardzo upraszczający pracę z modelem CreditMetrics nazywa się (oczywiście) CreditMetrics i jest dostępny na serwerach CRAN.

Wprowadzenie do modelowania ryzyka portfela kredytowego można znaleźć w artykułach Wojciecha Kuryłka: Modelowanie ryzyka portfela kredytowego. Część I oraz Modelowanie ryzyka portfela kredytowego. Część II.

Zainteresowanym modelem CreditMetrics proponuję przejrzenie jego dokumentacji: CreditMetrics – Technical Document.

Przy okazji, wszystkich zainteresowanych tematem zachęcam do spojrzenia na CRAN Task View: Empirical Finance. Wymienione są tam pakiety R użyteczne w zaawansowanych analizach i modelowaniu finansowym.

Oct
28

Analiza kursów akcji w systemie R

Światowy kryzys finansowy przypomniał mi czasy, kiedy zajmowałem się typową matematyką finansową. Od tego czasu wiele się zmieniło w dostępnym oprogramowaniu. Okazuje się, że R doskonale sobie radzi z analizą danych finansowych. Oprócz metod analizy system R umożliwia wygodny dostęp do danych finansowych online.

Analizujemy jeden indeks oraz ceny akcji trzech znanych firm:

  • ^NYA – New York Stock Exchange Composite (“^” oznacza, że mamy do czynienia z indeksem),
  • KO – Coca Cola.

Nazwy dwóch pozostałych firm łatwo można odgadnąć analizując kod.

Korzystamy z pakietu fImport. Jest on jednym z pakietów oferowanych na stronie Rmetrics. Rmetrics jest zestawem pakietów dla R przydatnych w inżynierii finansowej.

Wczytujemy dane z Yahoo oraz obliczamy korelacje przyrostów (zwrotów) cen akcji i indeksu giełdowego. Oto krótki kod:

library(fImport)


dane <- as.data.frame(yahooSeries(symbols = c("^NYA", "KO", "IBM", "DELL"), from = "2008-01-01", to = "2008-10-24")) # wczytujemy dane z Yahoo


dane <- dane[, grep("Close", names(dane), value=TRUE)] # bierzemy tylko kursy zamknięcia (korzystamy z wyrażeń regularnych)


# wyliczamy zwroty
n <- dim(dane)[1]
dane.zwroty <- (dane[2:n,] - dane[1:(n-1),]) / dane[1:(n-1),]


# liczymy i pokazujemy macierz korelacji
print(cor(dane.zwroty))
heatmap(cor(dane.zwroty), cexRow=.8, cexCol=.8, symm=T, rewC=T)

Ciekawostką jest wykorzystanie w kodzie wyrażeń regularnych (funkcja grep).

Oczywiście, można wykonać na naszych danych także całkiem inne analizy i wykresy.

Zachęcam w związku z tym wszystkich zainteresowanych do odwiedzenia strony pakietu
quantmod. Pakiet ten umożliwia on wczytywanie do R danych finansowych z Google Finance oraz operacje na nich. Można budować i testować modele dla traderów oraz tworzyć atrakcyjne wykresy. Pakiet quantmod jest także dostępny standardowo na serwerach CRAN.

Oct
02

Praca z plikami w systemie R

Czasami zdarza się konieczność wczytania do systemu R wielu plików z pewnego katalogu. Ja wykorzystywałem taką możliwość podczas obróbki obrazów (rozpoznawanie twarzy). Do R były wczytywane pliki z odpowiednim rozszerzeniem. Oto krótki przykład:

lista.plikow <- list.files(path=".", full.name = TRUE, pattern = ".jpg")
print(lista.plikow)

Po wczytaniu listy plików wystarczy odczytać z niej kolejne nazwy i wczytać pliki. Niestety, ten przykład zwróci najprawdopodobniej pustą listę. Po prostu w domyślnym katalogu roboczym R nie powinno być plików z rozszerzeniem *.jpg. Można zmienić katalog roboczy na taki, w którym odpowiednie pliki są ("Change dir..." z menu "File" albo instrukcja setwd.

Co ciekawe, parametr pattern może być dowolnym wyrażeniem regularnym. Oto kolejny przykład. Tym razem tworzymy listę plików sztucznie, zamiast wczytywać z dysku. Wyrażenie regularne z drugiej linii kodu poniżej może zostać użyte w parametrze pattern:

lista.plikow <- paste("Plik", 0:110, sep="_")
grep("Plik_[2-9][0-9]$", lista.plikow, value=TRUE)

Przy okazji, inna przydatna funkcja to file.choose. Umożliwia ona łatwe wybieranie pliku przez użytkownika.

Oct
01

Książki o GNU R

Znane wydawnictwa również zauważają rosnącą popularność systemu R. Świadczy o tym fakt, że Springer i Cambridge University Press wydają sporo książek temat systemu R oraz jego zastosowań. Listę książek wydanych przez Springera w poświęconej GNU R serii “UseR” można znaleźć tutaj: Springer Use R. Większość książek dotyczących R wydanych przez Cambridge University Press wymieniona jest tutaj: Cambridge Statistics R.

Moją ulubiona książka dotycząca R to “R Graphics” Paula Murrella. Więcej informacji jest na stronie wydawcy.

Oct
01

Szkolenie z budowy systemów scoringowych

W dniach 4-5.12.2008 prowadzę w Warszawie dla firmy eForum szkolenie z systemów scoringowych “Zastosowanie Punktowych Metod Oceny Klientów (Rating/Scoring Kredytowy I)”.

Szkolenie przeznaczone jest głównie dla początkujących i wprowadza uczestników od podstaw w tematykę budowy systemów scoringowych. Najważniejsze w szkoleniu jest przedstawienie kompletnej metodologii budowy systemów scoringowych. Ważnym elementem jest omówienie pojęć z zakresu systemów scoringowych, prezentacja kolejnych etapów budowy karty scoringowej oraz ćwiczenia praktyczne, podczas których uczestnicy szkolenia będą budować własne modele scoringowe.

Zapraszam wszystkich zainteresowanych!

Szkolenie to jest pierwszym z organizowanego przez firmę eForum cyklu szkoleń dotyczących systemów scoringowych. O kolejnych szkoleniach napiszę później.



szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław