Învățare automată automată
Învățare automată ( AutoML ) este procesul de automatizare a procesului de la capăt la capăt al aplicării învățării automate la problemele din lumea reală. Într-o aplicație tipică de învățare automată, utilizatorul trebuie să aplice adecvate de preprocesare a datelor , inginerie de caracteristici, extracție de caracteristici și de selecție a caracteristicilor care fac setul de date adecvat pentru învățarea automată. După acești pași, lucrătorul trebuie să efectueze selecția algoritmului și optimizarea hiperparametrului pentru a maximiza performanța prevăzută a modelului final. Deoarece mulți dintre acești pași nu pot fi făcuți de oameni fără a fi experți, abordarea AutoML a fost propusă ca o soluție bazată pe inteligență artificială pentru nevoia din ce în ce mai mare de învățare automată [1] [2] . Automatizarea procesului end-to-end de aplicare a învățării automate are avantajul de a obține soluții mai simple, crearea mai rapidă a unor astfel de soluții și modele care depășesc adesea modelele construite manual.
Învățarea automată automată poate viza diferite etape ale procesului [2] :
- pregătirea automată a datelor și colectarea și stocarea datelor (din date brute și diferite formate):
- detectarea automată a tipului de coloană, cum ar fi date booleene, date numerice discrete, valori numerice continue sau text;
- determinarea automată a semnificației coloanei; de exemplu, o țintă, o etichetă, un câmp de regionalizare , un atribut numeric, o categorie de text sau text liber;
- descoperirea automată a sarcinilor, cum ar fi clasificarea binară , regresia , gruparea sau clasarea ;
- construcție automată a caracteristicilor :
- selecție caracteristică
- extragerea caracteristicilor
- meta -learning [ și transfer learning
- detectarea și prelucrarea datelor asimetrice sau a valorilor lipsă;
- selectarea automată a modelului ;
- optimizarea hiperparametrilor algoritmului de învățare și caracterizare;
- selectarea automată a canalelor în funcție de timp, memorie și limite de dificultate;
- selectarea automată a metricilor de evaluare și a procedurilor de validare;
- verificare automată a sarcinii:
- detectarea scurgerilor;
- identificarea erorilor de configurare;
- analiza automata a rezultatelor obtinute;
- rezultate personalizate și vizualizare pentru învățarea automată automată
Note
- ↑ Auto-WEKA: Selecția combinată și optimizarea hiperparametrică a algoritmilor de clasificare . KDD '13 Proceedings of the 19th ACM SIGKDD international Conference on Knowledge discovery and data mining. pp. 847-855.
- ↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B și Larochelle H. AutoML 2014 @ ICML . Atelierul AutoML 2014 @ ICML . Preluat: 28 martie 2018. (nedefinit)
Literatură
- Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: Selectarea automată a modelului și optimizarea hiperparametrului în WEKA // Journal of Machine Learning Research. — 2017.
- Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Efficient and Robust Automated Machine Learning // Advances in Neural Information Processing Systems 28 (NIPS 2015). — 2015.
- Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Automating biomedical data science through tree-based pipeline optimization // Proceedings of EvoStar 2016. - 2016. - doi : 10.1007/978-3-319-31204 -0_9 . - arXiv : 1601.07925 .
- Olson RS, Bartley N., Urbanowicz RJ, Moore JH Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science // Proceedings of EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . - arXiv : 1603.06212 .
- Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. REȚETA : Un cadru bazat pe gramatică pentru conductele de clasificare care evoluează automat . - Springer International Publishing, 2017. - (Lecture Notes in Computer Science). — ISBN 9783319556956 . - doi : 10.1007/978-3-319-55696-3_16 .