Artur Suchwałko

szkolenia: ryzyko kredytowe, data mining, statystyka, analiza danych

Blog December, 2008

Dec
10

Analiza dużych zbiorów danych w GNU R

Jedną z wad systemu R jest trudna praca z dużymi danymi. Dlaczego? Dane, na których pracuje R, powinny mieścić się w pamięci operacyjnej komputera. Istnieje kilka sposobów obejścia tego problemu.

Ciekawym przykładem jest pakiet biglm. Pozwala on na budowę modeli regresji liniowej i uogólnionych modeli liniowych (do tej grupy należy na przykład często używana w budowie systemów scoringowych regresja logistyczna) dla danych, które nie mieszczą się w pamięci komputera.

Dec
10

Łączenie GNU R i MS Excel

Często zdarza się potrzeba przeprowadzenia bardziej skomplikowanych obliczeń w arkuszu Excel. Przykładem takiego zadania mogą być bardziej zaawansowane testy statystyczne. Jednym z rozwiązań jest napisanie odpowiedniego kodu w Visual Basic’u. Druga z opcji to skorzystanie z GNU R jako silnika obliczeniowego.

Jednym z wykorzystywanych do tego celu rozwiązań jest RExcel. GNU R staje się dostępny z menu Excel’a, w formułach umieszczonych w komórkach Excel’a oraz z poziomu Visual Basic’a.

RExcel wykorzystuje technologię (D)-COM, dzięki której GNU R może być wykorzystywany przez oprogramowanie praktycznie w dowolnym języku na platformie Windows (patrz: R (D)COM Server).

Ten wpis to kontynuacja postu dotyczącego pakietu xlsReadWrite.



szkolenia | data mining | analiza danych | statystyka | system statystyczny R | predictive modeling

prognozowanie | credit scoring | ryzyko kredytowe | programowanie | eksploracyjna analiza danych

analiza skupień | klasyfikacja | wizualizacja | darmowe oprogramowanie statystyczne | Wrocław