Limbajul de marcare pentru modelarea predictivă

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 6 iulie 2019; verificările necesită 3 modificări .

Predictive Model Markup Language ( PMML ) este un limbaj de marcare bazat pe XML dezvoltat de Data Mining Group (DMG) care oferă aplicațiilor o modalitate de a defini modele legate de analiza predictivă și analiza datelor și de a schimba astfel de modele între aplicații compatibile cu PMML.

PMML oferă aplicațiilor o metodă independentă de furnizor pentru definirea unui model, astfel încât problemele de proprietate și incompatibilitățile nu mai reprezintă o barieră în partajarea modelelor între aplicații. Permite utilizatorilor să dezvolte modele într-o aplicație a unui furnizor și să utilizeze aplicațiile altor furnizori pentru a vizualiza, analiza, evalua și utiliza în alt mod modelele. Anterior, acest lucru era dificil, dar cu PMML, schimbul de modele între aplicații compatibile a devenit mai ușor.

Deoarece PMML este un standard bazat pe XML, specificațiile sale sunt sub forma limbajului de marcare XML Schema .

Componente PMML

PMML conține un cadru intuitiv pentru descrierea unui model de analiză a datelor, fie că este vorba despre o rețea neuronală artificială sau regresie logistică .

Poate fi descris prin următoarea secvență de componente [1] [2] :

Aceste informații sunt urmate de trei tipuri de straturi neuronale care definesc arhitectura modelului de rețea neuronală reprezentată de documentul PMML. Acestea sunt atributele NeuralInputs, NeuralLayer și NeuralOutputs. Pe lângă rețelele neuronale, PMML permite reprezentarea multor alte modele de data mining, inclusiv mașină vectorială de suport , reguli de asociere , clasificator bayes naiv , modele de clustering, modele text, arbori de decizie , precum și diverse modele de regresie.

PMML 4.x

Versiunea PMML, 4.0, a fost lansată pe 16 iunie 2009 [3] [4] [5] .

Printre noile caracteristici:

PMML 4.1 a fost lansat pe 31 decembrie 2011. [6] [7]

PMML 4.2 a fost lansat pe 28 februarie 2014. [8] [9]

PMML 4.3 a fost lansat pe 23 august 2016. [10] [11]

Printre noile caracteristici:

Istoricul lansărilor

Versiunea 0.7 iulie 1997
Versiunea 0.9 iulie 1998
Versiunea 1.0 august 1999
Versiunea 1.1 august 2000
Versiunea 2.0 august 2001
Versiunea 2.1 martie 2003
Versiunea 3.0 octombrie 2004
Versiunea 3.1 decembrie 2005
Versiunea 3.2 mai 2007
Versiunea 4.0 iunie 2009
Versiunea 4.1 decembrie 2011
Versiunea 4.2 februarie 2014
Versiunea 4.2.1 martie 2015
Versiunea 4.3 august 2016

Produse care acceptă PMML

Gama de produse software oferite pentru crearea și utilizarea PMML:

Transform Generator

PMML oferă o gamă largă de transformări de date, inclusiv maparea valorii, normalizarea și discretizarea. De asemenea, oferă mai multe funcții încorporate, precum și operații aritmetice și logice care pot fi combinate pentru a reprezenta pași complexe de preprocesare. Folosind Generatorul de transformări , puteți crea grafic o transformare și puteți obține codul PMML corespunzător.

Note

  1. A. Guazzelli, M. Zeller, W. Chen și G. Williams. PMML: Un standard deschis pentru partajarea modelelor . The R Journal , volumul 1/1, mai 2009.
  2. A. Guazzelli, W. Lin, T. Jena (2010). PMML în acțiune: dezlănțuirea puterii standardelor deschise pentru extragerea datelor și analiza predictivă . creați spațiu.
  3. Site-ul web al Data Mining Group | PMML 4.0 - Modificări față de PMML 3.2 Arhivat din original pe 28 iulie 2012.
  4. Site-ul web Zementis | PMML 4.0 este aici! (link indisponibil) . Preluat la 2 septembrie 2011. Arhivat din original la 3 octombrie 2011. 
  5. R. Pechter. Ce este PMML și ce este nou în PMML 4.0? Buletinul informativ ACM SIGKDD Explorations , volumul 11/1, iulie 2009.
  6. Site-ul web al Data Mining Group | PMML 4.1 - Modificări față de PMML 4.0
  7. Site-ul web Predictive Analytics Info | PMML 4.1 este aici!
  8. Site-ul web al Data Mining Group | PMML 4.2 - Modificări față de PMML 4.1 Arhivat din original pe 20 mai 2014.
  9. Site-ul web Predictive Analytics Info | PMML 4.2 este aici!
  10. Site-ul web al Data Mining Group | PMML 4.3 - Modificări față de PMML 4.2.1
  11. Site-ul web al produsului Predictive Model Markup Language | activitate de proiect

Link -uri