Sarcina de clasificare este o sarcină în care există multe obiecte ( situații ) împărțite, într-un fel, în clase . Este dat un set finit de obiecte pentru care se știe căreia îi aparțin clasele. Acest set se numește eșantion . Afilierea de clasă a restului obiectelor este necunoscută. Este necesar să se construiască un algoritm capabil să clasifice (vezi mai jos) un obiect arbitrar din mulțimea inițială .
A clasifica un obiect înseamnă a indica numărul (sau numele) clasei căreia îi aparține obiectul dat.
Clasificarea obiectului - numărul sau numele clasei, emis de algoritmul de clasificare ca urmare a aplicării sale la acest obiect particular.
În statistica matematică , problemele de clasificare sunt numite și probleme de analiză discriminantă . În învățarea automată , problema clasificării este rezolvată, în special, folosind metodele rețelelor neuronale artificiale atunci când se realizează un experiment sub formă de instruire cu un profesor .
Există, de asemenea, alte moduri de a stabili un experiment - învățare nesupravegheată , dar ele sunt folosite pentru a rezolva o altă problemă - grupare sau taxonomie . În aceste probleme, împărțirea obiectelor eșantion de antrenament în clase nu este specificată și este necesară clasificarea obiectelor numai pe baza asemănării lor între ele. În unele domenii aplicate, și chiar în statistica matematică în sine, din cauza apropierii problemelor, problemele de grupare nu se disting adesea de problemele de clasificare.
Unii algoritmi pentru rezolvarea problemelor de clasificare combină învățarea supravegheată cu învățarea nesupravegheată , de exemplu, o versiune a rețelelor neuronale Kohonen este rețelele de cuantizare vectorială supravegheată.
Fie un set de descrieri ale obiectelor, fie un set de numere (sau nume) de clase. Există o dependență necunoscută a țintei - mapare , ale cărei valori sunt cunoscute numai pe obiectele eșantionului final de antrenament . Este necesar să se construiască un algoritm capabil să clasifice un obiect arbitrar .
Enunțul probabilistic al problemei este considerat mai general. Se presupune că mulțimea de perechi „obiect, clasă” este un spațiu de probabilitate cu o măsură de probabilitate necunoscută . Există un set finit de antrenament de observații generate în funcție de măsura probabilității . Este necesar să se construiască un algoritm capabil să clasifice un obiect arbitrar .
Un semn este o mapare , unde este setul de valori admisibile ale unui semn. Dacă sunt date caracteristici , atunci vectorul este numit o descriere a caracteristicilor obiectului . Descrierile indicative pot fi identificate cu obiectele în sine. În acest caz, setul se numește spațiu caracteristic .
În funcție de set, semnele sunt împărțite în următoarele tipuri:
Adesea există probleme aplicate cu diferite tipuri de caracteristici, nu toate metodele sunt potrivite pentru rezolvarea lor.
Clasificarea semnalelor și imaginilor se mai numește și recunoaștere a modelelor .
Învățare automată și extragerea datelor | |
---|---|
Sarcini | |
Învățarea cu un profesor | |
analiza grupului | |
Reducerea dimensionalității | |
Prognoza structurală | |
Detectarea anomaliilor | |
Modele grafice probabilistice | |
Rețele neuronale | |
Consolidarea învățării |
|
Teorie | |
Reviste și conferințe |
|