Funcția de bază radială

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 2 iunie 2021; verificarea necesită 1 editare .

Funcția de bază radială ( RBF ) este o funcție dintr-un set de funcții radiale de același tip utilizată ca funcție de activare într-un strat al unei rețele neuronale artificiale sau altfel, în funcție de context. O funcție radială  este orice funcție reală a cărei valoare depinde numai de distanța până la origine sau de distanța dintre un alt punct numit centru : . Norma este, de obicei, distanța euclidiană , deși pot fi utilizate alte metrici .

Combinațiile liniare ale funcțiilor de bază radială pot fi, de asemenea, utilizate pentru a aproxima o funcție dată . Aproximarea poate fi interpretată ca cel mai simplu tip de rețea neuronală ; în acest context, funcțiile de bază radială au fost definite pentru prima dată de David Broomhead și David Lowe în 1988 [1] [2] , pe baza lucrării fundamentale din 1977 a lui Michael Powell [3] [4] [5] .

Funcțiile de bază radială sunt, de asemenea, utilizate ca nucleu în mașinile vector suport . [6]

Specie

Funcțiile de bază radială utilizate în mod obișnuit includ ( ):

Aproximare

Pentru a aproxima funcții folosind funcții de bază radială, combinația lor liniară a formei este de obicei luată:

,

unde suma funcţiilor de bază radială cu centre în puncte şi coeficienţi este luată ca funcţie de aproximare . Coeficienții pot fi calculați folosind metoda celor mai mici pătrate , deoarece funcția de ajustare este liniară în raport cu coeficienții .

Schemele de aproximare de acest fel sunt deosebit de utile. în prognoza serii de timp , controlul sistemelor neliniare care prezintă un comportament haotic destul de simplu și modelare 3D în grafica computerizată .

Rețele neuronale bazate pe RBF

Combinație liniară:

poate fi interpretată și ca cea mai simplă rețea neuronală artificială cu un singur strat, numită rețea de funcții de bază radială , în care funcția de bază radială joacă rolul unei funcții de activare. Se poate arăta că orice funcție continuă pe un interval compact poate fi, în principiu, interpolată cu o precizie arbitrară pentru suficient de mare .

Aproximația este diferențiabilă în raport cu . Coeficienții pot fi calculați folosind orice metodă iterativă standard pentru rețelele neuronale.

Astfel, funcțiile de bază radială oferă un instrument de interpolare flexibil, cu condiția ca setul de centre să acopere mai mult sau mai puțin uniform domeniul funcției dorite (în mod ideal, centrele ar trebui să fie echidistante de vecinii lor cei mai apropiați). Cu toate acestea, de regulă, în punctele intermediare, aproximarea atinge o precizie ridicată numai dacă setul de funcții de bază radială este completat de un polinom ortogonal la fiecare dintre RBF.

Note

  1. Radial Basis Function networks Arhivat 23 aprilie 2014.
  2. Broomhead, Lowe, 1988 , p. 321–355
  3. Michael J. D. Powell; Michael JD Powell. Reporniți procedurile pentru metoda gradientului conjugat  //  Programare matematică : jurnal. - Springer, 1977. - Vol. 12 . - P. 241-254 . - doi : 10.1007/bf01593790 .
  4. Sahin, Ferat (1997). O abordare a funcției pe bază radială a unei probleme de clasificare a imaginilor color într-o aplicație industrială în timp real (PDF) (M.Sc.). Virginia Tech . p. 26. Arhivat din original (PDF) la 26-10-2015 . Extras 2018-06-02 . Funcțiile de bază radială au fost introduse pentru prima dată de Powell pentru a rezolva problema reală de interpolare multivariată. Parametrul depreciat folosit |deadlink=( ajutor )
  5. Broomhead, Lowe, 1988 , p. 347: „Am dori să mulțumim profesorului MJD Powell de la Departamentul de Matematică Aplicată și Fizică Teoretică de la Universitatea Cambridge pentru că a oferit stimulul inițial pentru această lucrare”.
  6. VanderPlas, Jake Introducere în suportul mașinilor vectoriale (link nu este disponibil) . [O'Reilly] (6 mai 2015). Preluat la 14 mai 2015. Arhivat din original la 5 septembrie 2015. 

Literatură