Problema de clasificare

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 14 august 2019; verificările necesită 6 modificări .

Sarcina de clasificare  este o sarcină în care există multe obiecte ( situații ) împărțite, într-un fel, în clase . Este dat un set finit de obiecte pentru care se știe căreia îi aparțin clasele. Acest set se numește eșantion . Afilierea de clasă a restului obiectelor este necunoscută. Este necesar să se construiască un algoritm capabil să clasifice (vezi mai jos) un obiect arbitrar din mulțimea inițială .

A clasifica un obiect înseamnă a indica numărul (sau numele) clasei căreia îi aparține obiectul dat.

Clasificarea obiectului - numărul sau numele clasei, emis de algoritmul de clasificare ca urmare a aplicării sale la acest obiect particular.

În statistica matematică , problemele de clasificare sunt numite și probleme de analiză discriminantă . În învățarea automată , problema clasificării este rezolvată, în special, folosind metodele rețelelor neuronale artificiale atunci când se realizează un experiment sub formă de instruire cu un profesor .

Există, de asemenea, alte moduri de a stabili un experiment - învățare nesupravegheată , dar ele sunt folosite pentru a rezolva o altă problemă - grupare sau taxonomie . În aceste probleme, împărțirea obiectelor eșantion de antrenament în clase nu este specificată și este necesară clasificarea obiectelor numai pe baza asemănării lor între ele. În unele domenii aplicate, și chiar în statistica matematică în sine, din cauza apropierii problemelor, problemele de grupare nu se disting adesea de problemele de clasificare.

Unii algoritmi pentru rezolvarea problemelor de clasificare combină învățarea supravegheată cu învățarea nesupravegheată , de exemplu, o versiune a rețelelor neuronale Kohonen  este rețelele de cuantizare vectorială supravegheată.

Enunțul matematic al problemei

Fie un set de descrieri ale obiectelor, fie un set de numere (sau nume) de clase. Există o dependență necunoscută a țintei - mapare , ale cărei valori sunt cunoscute numai pe obiectele eșantionului final de antrenament . Este necesar să se construiască un algoritm capabil să clasifice un obiect arbitrar .

Enunț probabilistic al problemei

Enunțul probabilistic al problemei este considerat mai general. Se presupune că mulțimea de perechi „obiect, clasă” este un spațiu de probabilitate cu o măsură de probabilitate necunoscută . Există un set finit de antrenament de observații generate în funcție de măsura probabilității  . Este necesar să se construiască un algoritm capabil să clasifice un obiect arbitrar .  

Spațiu de caracteristici

Un semn este o mapare , unde  este setul de valori admisibile ale unui semn. Dacă sunt date caracteristici , atunci vectorul este numit o descriere a caracteristicilor obiectului . Descrierile indicative pot fi identificate cu obiectele în sine. În acest caz, setul se numește spațiu caracteristic .

În funcție de set, semnele sunt împărțite în următoarele tipuri:

Adesea există probleme aplicate cu diferite tipuri de caracteristici, nu toate metodele sunt potrivite pentru rezolvarea lor.

Tipologia problemelor de clasificare

Tipuri de date de intrare

Clasificarea semnalelor și imaginilor se mai numește și recunoaștere a modelelor .

Tipuri de clasă

Vezi și

Link -uri

Literatură