Caracteristică (învățare automată)

În învățarea automată și recunoașterea modelelor, o caracteristică este o proprietate individuală măsurabilă sau o caracteristică a unui fenomen observat [1] . Selectarea caracteristicilor informative, distinctive și independente este un pas critic pentru algoritmi eficienți în recunoașterea modelelor , clasificarea și regresia . Caracteristicile sunt de obicei numerice, dar caracteristicile structurale precum șirurile și graficele sunt utilizate în recunoașterea modelelor sintactice . Conceptul de „trăsătură” este legat de variabilele explicative utilizate în tehnicile statistice , cum ar fi regresia liniară .

Clasificare

Setul de caracteristici numerice este descris convenabil de un vector de caracteristici. Un exemplu de realizare a unei clasificări cu două caracteristici dintr-un vector caracteristic (asociat cu un perceptron ) constă în calcularea produsului punctual al vectorului caracteristic și al vectorului de greutate, comparând rezultatul cu o valoare de prag și decide cărei clase îi aparține obiectul. pe baza acelei comparații.

Algoritmii de clasificare care se bazează pe vectorii caracteristici includ clasificarea celui mai apropiat vecin , rețelele neuronale și tehnici statistice, cum ar fi abordarea bayesiană .

Exemple

În recunoașterea caracterelor, caracteristicile pot include histograme , inclusiv numărul de puncte negre de-a lungul direcțiilor orizontale și verticale, numărul de goluri interne, accentuarea conturului și multe altele.

În recunoașterea vorbirii, caracteristicile pentru recunoașterea fonemelor pot include cifra zgomotului, lungimea sunetelor, volumul relativ, potrivirea filtrului și multe altele.

În algoritmii de detectare a spam- ului, caracteristicile pot include prezența sau absența unor anteturi de e-mail, structura e-mailului, limba, frecvența anumitor termeni, corectitudinea gramaticală a textului.

În viziunea computerizată , există un număr mare de caracteristici posibile , cum ar fi marginile și obiectele.

Extensii

În recunoașterea modelelor și învățarea automată, un vector de caracteristici este un vector n-dimensional de caracteristici numerice care reprezintă un obiect. Mulți algoritmi din învățarea automată necesită o reprezentare numerică a obiectelor, deoarece astfel de reprezentări facilitează procesarea și analiza statistică. Când lucrați cu imagini, o caracteristică poate corespunde punctelor de imagine (pixeli), în timp ce caracteristicile pentru text pot corespunde frecvenței de utilizare a termenilor din text. Vectorii caracteristici sunt echivalenti cu vectorii variabilelor explicative utilizate în procedurile statistice , cum ar fi regresia liniară . Vectorii caracteristici sunt adesea combinați cu greutăți folosind produsul punctual pentru a construi o funcție de predicție liniară , care este utilizată pentru a determina scorul pentru predicție.

Spațiul vectorial asociat acestor vectori este adesea numit spațiu caracteristic . Mai multe tehnici de reducere a dimensionalității pot fi utilizate pentru a reduce dimensiunea spațiului caracteristic .

Caracteristicile de nivel superior pot fi derivate din caracteristici deja cunoscute și adăugate vectorului de caracteristici. De exemplu, pentru studiul bolilor, este util atributul „vârsta”, care poate fi definit ca vârstă = „anul morții” minus „anul nașterii” . Acest proces este denumit construirea caracteristicilor [2] [3] . Construcția caracteristicilor este aplicarea unui set de operatori de construcție la un set de caracteristici existente, având ca rezultat construirea de noi caracteristici. Exemple de astfel de operatori de construcție includ teste de egalitate {=, ≠}, operatori aritmetici {+,−,×, /}, operatori de matrice {max(S), min(S), medie(S)} și operatori mai complexi, de exemplu, count(S,C) [4] , care numără numărul de caracteristici din vectorul caracteristic S care satisfac o anumită condiție C, sau, de exemplu, distanța până la o altă clasă de recunoaștere generalizată de un dispozitiv. Construirea caracteristicilor este considerată un instrument puternic atât pentru creșterea acurateței, cât și pentru îmbunătățirea înțelegerii structurii, în special în problemele cu dimensiuni mari [5] . Aplicațiile includ studiul bolii și recunoașterea emoțiilor în conversație [6] .

Selectare și selecție

Setul inițial de caracteristici brute poate fi redundant și prea mare pentru a fi procesat. Astfel, un pas preliminar în multe aplicații de învățare automată și recunoaștere a modelelor constă în selectarea unui subset de caracteristici sau construirea unui nou set redus de caracteristici pentru a oferi învățarea pentru a îmbunătăți generalitatea și interpretabilitatea.

Izolarea sau selectarea caracteristicilor este o combinație de artă și știință. Sistemele care fac acest lucru sunt cunoscute sub denumirea de sisteme de inginerie a caracteristicilor . Extragerea și selectarea caracteristicilor necesită experimentarea cu multe posibilități, precum și capacitatea de a combina tehnici automate cu intuiția și cunoștințele unui specialist îngust în acest domeniu. Automatizarea acestui proces se numește învățarea caracteristicilor , în care mașina nu numai că folosește caracteristicile pentru a învăța singură, ci învață și noi caracteristici.

Vezi și

Note

  1. Episcop, 2006 .
  2. Liu, Motoda, 1998 .
  3. Piramuthu, Sikora, 2009 , p. 3401-3406.
  4. Bloedorn și Michalski 1998 , p. 30-37.
  5. Breiman, Friedman, Olshen, Stone, 1984 .
  6. Sidorova, Badia, 2009 .

Literatură

Lectură suplimentară