28
Ułatwienie pracy z modelami predykcyjnymi w GNU R: PMML
Posted under analiza danych, data mining, GNU R by Artur SuchwałkoPMML (Predictive Model Markup Language) jest opartym na XML językiem, który umożliwia wygodny eksport modeli predykcyjnych z narzędzia analitycznego, w którym model powstał, do systemu, w którym model będzie wykorzystywany (na przykład definiującego listy mailingowe dla kampanii marketingowej). Oczywiście, wyeksportowany w PMML model można wczytać do dowolnej innej aplikacji używającej standardu PMML i kontynuować pracę.
Specyfikacja PMML dostępna jest na stronie Data Mining Group.
System R posiada możliwość eksportu modeli zgodnie ze standardem PMML. Pakiet nazywa się PMML i oferuje możliwość eksportu podstawowych modeli. Według mnie najważniejszy z nich to drzewa klasyfikacyjne budowane z wykorzystaniem pakietu rpart. Pozostałe modele to sieci neuronowe, SVM, regresja liniowa i logistyczna oraz wyniki analizy skupień (k-means) i odkrywania reguł asocjacyjnych.
Można obejrzeć wideo pokazujące, jak z GNU R eksportuje się modele w formacie PMML.
Wyobrażenie o częstości korzystania z PMML dają wyniki ankiety ze strony KDNuggets.
