Rețele neuronale recursive ( ing. Rețea neuronală recursiva ; RvNN ) este un tip de rețele neuronale care lucrează cu date de lungime variabilă. Modelele de rețea recursive folosesc structuri de tipar ierarhic în antrenament. De exemplu, imagini compuse din scene care combină subscene care includ multe obiecte. Dezvăluirea structurii scenei și deconstrucția acesteia nu este o sarcină banală. În acest caz, este necesar atât identificarea obiectelor individuale, cât și a întregii structuri a scenei.
În rețelele recursive, neuronii cu aceleași greutăți sunt activați recursiv în funcție de structura rețelei. În timpul funcționării rețelei recursive, se dezvoltă un model de predicție a structurilor de dimensiune variabilă și a structurilor scalare prin activarea structurii în conformitate cu topologia. RvNN-urile au fost folosite cu succes pentru a antrena structuri secvențiale și arbori în procesarea limbajului natural , unde frazele și propozițiile sunt modelate prin reprezentări vectoriale de cuvinte . RvNN-urile au apărut inițial pentru reprezentarea distribuită a structurilor folosind predicatele logicii matematice . [1] Dezvoltarea rețelelor recursive și a primelor modele au început la mijlocul anilor 1990. [2] [3]
În cea mai simplă arhitectură, nodurile rețelei converg către părinți printr-o matrice de greutate a stratului ascuns utilizată în mod repetat în întreaga rețea și o funcție de activare neliniară de tip tangentă hiperbolică . Dacă c 1 și c 2 sunt reprezentări n - dimensionale ale nodurilor de rețea, atunci părinții lor sunt și vectori n - dimensionali, calculati ca
Aici W este matricea de greutate antrenată .
Această arhitectură, cu unele îmbunătățiri, este folosită pentru decodarea secvențială a scenelor de imagini naturale sau pentru structurarea propozițiilor în limbaj natural. [patru]
Corelația recursive în cascadă RecCC este o abordare a construirii rețelelor recursive care operează cu trei domenii [2] , primele aplicații de acest gen au apărut în chimie [5] , iar extensia formează un graf aciclic direcționat . [6]
În 2004, a fost propus un sistem de învățare în rețea recursiv nesupravegheat . [7] [8]
Rețelele recursive tensorului folosesc o funcție tensorală pentru toate nodurile arborescente . [9]
Coborârea gradientului stocastic (SGD) este de obicei folosită pentru antrenament . Gradientul este definit prin cadrul de backpropagation end-to-end (BPTS), această metodă este o modificare a backpropagation-ului în serie de timp folosită pentru a antrena rețele neuronale recurente .
Literatura de specialitate confirmă capacitatea de aproximare universală prin rețele recurente peste rețele de tip arbore. [10] [11]
O rețea neuronală recurentă este o rețea recursivă cu o structură specifică - sub forma unui lanț liniar. Rețelele recursive operează pe structuri de tip general, inclusiv o ierarhie, rețelele recurente operează exclusiv pe o progresie liniară în timp, conectând punctul anterior în timp cu următorul printr-un strat neuronal ascuns.
Rețeaua ecou arbore este un exemplu eficient de rețele neuronale recursive [12] folosind paradigma de calcul Reservoir.
Extinderea structurii la grafice produce o rețea neuronală grafică (GNN), [13] , o rețea neuronală pentru grafice (NN4G), [14] și rețele neuronale convoluționale mai noi pentru grafice.
Tipuri de rețele neuronale artificiale | |
---|---|
|
Învățare automată și extragerea datelor | |
---|---|
Sarcini | |
Învățarea cu un profesor | |
analiza grupului | |
Reducerea dimensionalității | |
Prognoza structurală | |
Detectarea anomaliilor | |
Modele grafice probabilistice | |
Rețele neuronale | |
Consolidarea învățării |
|
Teorie | |
Reviste și conferințe |
|