Un nucleu de șir este o funcție de nucleu definită pe șiruri de caractere , adică secvențe finite de caractere care nu au neapărat aceeași lungime. Nuezele de șiruri pot fi înțelese intuitiv ca funcții care măsoară asemănarea perechilor de șiruri - cu cât două șiruri a și b sunt mai asemănătoare, cu atât valoarea nucleului de șiruri K(a, b) este mai mare .
Utilizarea nucleelor de șir cu algoritmi de învățare a nucleului , cum ar fi mașinile de vectori de suport, permite unor astfel de algoritmi să opereze pe șiruri de caractere fără a fi nevoie să le convertească în vectori caracteristici de lungime constantă care au elemente reale [1] . Nuezele de șiruri sunt utilizate în zonele în care o secvență de date este grupată sau clasificată, cum ar fi procesarea datelor de text și analiza genelor [2] .
Să presupunem că cineva va compara automat două bucăți de text și va determina similaritatea lor relativă. Pentru multe aplicații, poate fi suficient să găsiți câteva cuvinte cheie care se potrivesc complet. Un exemplu în care o astfel de potrivire exactă nu este întotdeauna suficientă poate fi găsit în detectoarele de spam [3] . Un alt exemplu este analiza genelor computerizate, în care genele omoloage au mutații în care caracterele din secvența generală pot fi șterse, inserate sau înlocuite.
Deoarece unele metode bine stabilite de grupare, clasificare și extragere a informațiilor din date (de exemplu, mașina de suport vector) sunt concepute pentru a funcționa cu vectori (adică, datele reprezintă elemente ale unui spațiu vectorial), utilizarea unui nucleu de șiruri permite aceste metode să fie extinse la date secvenţiale.
Metoda nucleului șirurilor contrastează cu abordările de clasificare a textului obișnuite înainte de apariția sa, unde vectorii de caracteristică au arătat doar prezența sau absența unui cuvânt. Acest lucru nu numai că a îmbunătățit abordările existente, dar este și un exemplu al modului în care întreaga clasă de nuclee se adaptează la structurile de date care au început să apară în secolul 21. O trecere în revistă a unor astfel de metode a fost făcută de Gärtner [4] .
În bioinformatică, nucleele de șir sunt folosite pentru a transforma secvențe biologice, cum ar fi proteinele sau ADN-ul, în vectori pentru a fi utilizate în continuare în modelele de învățare automată. Un exemplu de nucleu de șir pentru astfel de scopuri este nucleul de profil [5] .
Nucleul domeniului D este o funcție care îndeplinește anumite condiții ( simetric în argumente, continuu , definit pozitiv într-un anumit sens).
Teorema lui Mercer afirmă că K poate fi exprimat apoi ca ofuncție c caremapează argumentele la un spațiu de produs punctual .
Acum putem reproduce definiția nucleului de subsecvențe de șiruri [1] peste șiruri din alfabet . Maparea în funcție de coordonate este definită după cum urmează:
Indicii sunt multi -indici , iar u este un șir de lungime n - subsecvențele pot fi discontinue, dar golurile sunt penalizate. Multi-indexul specifică pozițiile de potrivire ale caracterelor din u și s . este diferența dintre primul și ultimul element din , adică cât de departe este o subsecvență din s de subsecvența corespunzătoare din u . Parametrul poate fi setat la orice valoare între 0 (nu sunt permise goluri, deoarece doar 0 0 nu este 0, ci 1) și 1 (subsecvențele chiar și cu distanțe mari cântăresc la fel ca și fără distanțe, adică ca subsecvențe continue), din moment ce .
Pentru unii algoritmi importanți, datele sunt obținute de algoritm numai în expresii care utilizează produsul scalar al vectorului caracteristic, motiv pentru care sunt numite metode kernel . Prin urmare, este de dorit ca nu ar fi necesar să se calculeze explicit transformarea , dar ar fi posibil să se calculeze numai produsul scalar prin nucleu, care poate fi mult mai rapid, mai ales când se utilizează aproximarea [1] .
Învățare automată și extragerea datelor | |
---|---|
Sarcini | |
Învățarea cu un profesor | |
analiza grupului | |
Reducerea dimensionalității | |
Prognoza structurală | |
Detectarea anomaliilor | |
Modele grafice probabilistice | |
Rețele neuronale | |
Consolidarea învățării |
|
Teorie | |
Reviste și conferințe |
|