Harta auto-organizată a lui Kohonen

Harta de auto-organizare a lui Kohonen ( Harta de auto -organizare în engleză   - SOM) este o rețea neuronală nesupravegheată care îndeplinește sarcina de vizualizare și grupare . Ideea unei rețele a fost propusă de omul de știință finlandez T. Kohonen . Este o metodă de proiectare a unui spațiu multidimensional într-un spațiu cu o dimensiune inferioară (cel mai adesea, bidimensională), este folosită și pentru rezolvarea problemelor de modelare, prognozare, identificarea unor seturi de caracteristici independente, căutarea de modele în seturi mari de date. , dezvoltarea de jocuri pe calculator, cuantificarea culorilor la numărul lor limitat de indici din paleta de culori: la imprimarea pe o imprimantă și mai devreme pe un PC sau pe set-top box-uri cu un afișaj cu un număr redus de culori, pentru arhivatori [scop general] sau codecuri video etc. Este una dintre versiunile rețelelor neuronale ale lui Kohonen .

Istorie

Metoda a fost propusă de omul de știință finlandez Teuvo Kohonen în 1984. Există multe modificări ale modelului original.

Structura rețelei

O hartă auto-organizată este formată din componente numite noduri sau neuroni. Numărul lor este stabilit de analist . Fiecare dintre noduri este descris de doi vectori. Primul este așa-numitul. un vector de greutate m care are aceeași dimensiune ca și intrarea. Al doilea este vectorul r , care este coordonatele nodului de pe hartă. Harta Kohonen este afișată vizual folosind celule dreptunghiulare sau hexagonale; acesta din urmă este folosit mai des, deoarece în acest caz distanțele dintre centrele celulelor adiacente sunt aceleași, ceea ce crește corectitudinea vizualizării hărții.

Inițial, dimensiunea datelor de intrare este cunoscută; într-un fel, versiunea inițială a hărții este construită pe ea. În timpul procesului de învățare, vectorii greutate nod se apropie de datele de intrare. Pentru fiecare observație (eșantion), se selectează cel mai asemănător nod din punct de vedere al vectorului de greutate, iar valoarea vectorului său de greutate se apropie de observație. De asemenea, vectorii de greutate ai mai multor noduri situate în apropiere se apropie de observație, așa că dacă două observații au fost similare în setul de date de intrare, nodurile apropiate le vor corespunde pe hartă. Procesul de învățare ciclică, iterând peste datele de intrare, se termină atunci când harta atinge o eroare acceptabilă (predeterminată de analist) sau după un număr specificat de iterații. Astfel, ca rezultat al antrenamentului, harta Kohonen clasifică datele de intrare în clustere și afișează vizual datele de intrare multidimensionale într-un plan bidimensional, distribuind vectori de caracteristici apropiate în celulele învecinate și colorându-i în funcție de parametrii analizați ai neuronilor.

Ca rezultat al algoritmului, se obțin următoarele hărți:

Funcționare în rețea

Algoritm

Există trei modalități cele mai comune de a seta greutățile inițiale ale nodurilor:

Fie  numărul iterației (inițializarea corespunde numărului 0).

, pentru orice , unde  este vectorul de greutate al nodului . Dacă există mai multe noduri care îndeplinesc condiția, BMU este selectată aleatoriu dintre ele. Funcția determină „măsura de vecinătate” a nodurilor și modificarea vectorilor de greutate. Ar trebui să-și rafineze treptat valorile, mai întâi la un număr mai mare de noduri și mai puternice, apoi la unul mai mic și mai slab. Adesea, o funcție Gaussiană este utilizată ca funcție de vecinătate: unde  este un factor de antrenament care scade monoton cu fiecare iterație ulterioară (adică determină aproximarea valorii vectorilor de greutate ai BMU și vecinilor săi la observație; cu cât treapta este mai mare, cu atât rafinamentul este mai mic); ,  - coordonatele nodurilor și pe hartă;  — factorul care reduce numărul de vecini cu iterații scade monoton. Parametrii și caracterul lor de scădere sunt stabiliți de analist. O modalitate mai ușoară de a defini o funcție de vecinătate: , dacă se află în vecinătatea unei raze predeterminate de analist, iar 0 în caz contrar. Funcția este egală pentru BMU și scade cu distanța față de BMU. Modificați vectorul de greutate conform formulei: Acea. vectorii de greutate ai tuturor nodurilor care sunt vecine cu BMU se apropie de observația luată în considerare. De exemplu, ca medie aritmetică a distanțelor dintre observații și vectorii de greutate ai BMU-urilor corespunzătoare: , unde N este numărul de elemente ale setului de date de intrare.

Caracteristicile modelului

Rezistenta la date zgomotoase, invatare rapida si nesupravegheata, capacitatea de a simplifica datele de intrare multivariate cu vizualizare. [2]

Hărțile Kohonen auto-organizate pot fi utilizate pentru analiza clusterului numai dacă numărul de clustere este cunoscut în prealabil [2] .

Un dezavantaj important este că rezultatul final al activității rețelelor neuronale depinde de setările inițiale ale rețelei. Pe de altă parte, rețelele neuronale pot aproxima teoretic orice funcție continuă, ceea ce permite cercetătorului să nu facă în avans nicio ipoteză despre model [2] .

Vezi și

Note

  1. Chubukova, 2000 , p. 140.
  2. 1 2 3 Manzhula, 2011 .

Literatură

Link -uri