Blestemul dimensiunii

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 28 aprilie 2021; verificările necesită 4 modificări .

Blestemul dimensionalității (CU) este un termen folosit în relație cu o serie de proprietăți ale spațiilor de dimensiuni mari și probleme combinatorii . În primul rând, aceasta se referă la creșterea exponențială a datelor experimentale necesare în funcție de dimensiunea spațiului atunci când se rezolvă probleme de recunoaștere probabilistic-statistică a modelelor , învățarea automată , clasificarea și analiza discriminantă . Acest lucru se aplică și creșterii exponențiale a numărului de opțiuni în problemele combinatorii în funcție de dimensiunea datelor inițiale, ceea ce duce la o creștere corespunzătoare a complexității algoritmilor de enumerare. „Blestemul” afectează și metodele de optimizare continuă datorită complexității funcției obiectiv multidimensionale. Într-un sens mai larg, termenul se aplică tuturor proprietăților „incomode” sau neobișnuite ale spațiilor cu dimensiuni mari și dificultăților studiului lor. În combinatorică, ele înseamnă adesea nu dimensiunea spațiului, ci dimensiunea datelor inițiale. În special, în problemele teoriei Ramsey ar fi mai corect să vorbim despre „blestemul mărimii” a datelor inițiale chiar și în cazul problemelor de dimensiune minimă – numărul de parametri care definesc problema. Termenul a fost introdus pentru prima dată de Richard Bellman în legătură cu problema generală a programării dinamice [1] [2] . Această expresie continuă să fie folosită în lucrările de cibernetică tehnică, învățarea automată și analiza sistemelor complexe, inclusiv în titlurile articolelor științifice [3] .

Exemple tipice

În probleme de recunoaștere

În problemele de recunoaștere probabilistică, există două situații în care blestemul dimensionalității poate fi depășit cu ajutorul abordărilor generale.

  1. Este posibilă o situație când distribuția unui vector de variabile aleatoare interdependente este concentrată într-un subspațiu de dimensiune inferioară, adică vectorul poate fi bine aproximat printr-o funcție liniară a unui număr mai mic de variabile. În acest caz, metoda componentelor principale permite reducerea dimensiunii. Mai mult, sarcinile stabilite de recunoaștere (discriminare) pot fi rezolvate deja într-un spațiu de dimensiuni reduse.
  2. Este posibilă o situație când variabilele aleatoare ale vectorilor studiați sunt independente sau, mai realist, slab interdependente. În acest caz, se pot restaura distribuțiile unidimensionale ale variabilelor aleatoare și se pot construi distribuții multivariate ca produse ale acestora. În plus, folosind același eșantion de antrenament în modul de examinare glisante, se poate restabili distribuția unidimensională a raportului funcțiilor de probabilitate ale claselor diferențiabile, ceea ce elimină părtinirea asociată cu interdependența în regula de decizie.

De obicei, pentru analiza datelor multidimensionale, se propune utilizarea metodei metrice a celui mai apropiat vecin [4] [5] . Avantajul metodei este că în mod formal poate fi aplicată probelor de orice dimensiune, indiferent de dimensiunea vectorilor. Dar problema aplicată fundamental a PR este că într-un eșantion limitat de date nu există suficiente informații despre un obiect descris de un număr mare de parametri semnificativi. Și dacă această descriere este cu adevărat complexă și multidimensională, iar rezolvarea problemei necesită o analiză a întregului complex de parametri, atunci problema se dovedește a fi dificilă și nu poate fi rezolvată prin metode generale.

Probleme de optimizare

În problemele de optimizare, există și metode care facilitează rezolvarea problemelor la scară largă.

Toate aceste metode de luptă nu rezolvă problema PR-ului în mod radical și sunt eficiente doar în cazuri speciale.

În teoria lui Ramsey

Deși problemele teoriei Ramsey permit de obicei generalizări multidimensionale, ele sunt dificile chiar și cu dimensiuni minime și dimensiuni mici ale datelor de intrare.

În geometria combinatorie

În geometria combinatorie, există câteva probleme dificile strict matematice legate direct de dimensiunea spațiului.

Câteva proprietăți „neobișnuite” ale spațiilor multidimensionale

Note

  1. Richard Ernest Bellman; corporația rand. Programare dinamică  (nedefinită) . - Princeton University Press , 1957. - ISBN 978-0-691-07951-6 . ,
    Republicat: Richard Ernest Bellman. Programare dinamică  (nedefinită) . — Courier Dover Publications , 2003. — ISBN 978-0-486-42809-3 .
  2. Richard Ernest Bellman. Procese de control adaptiv : un tur ghidat  . — Princeton University Press , 1961.
  3. ^ Powell, Warren B. 2007. Approximate Dynamic Programming: Solving the Curses of Dimensionality. Wiley, ISBN 0-470-17155-3 .
  4. Marimont, R. B.; Shapiro, MB Căutările celor mai apropiati vecini și blestemul dimensionalității  // IMA J Appl  Math : jurnal. - 1979. - Vol. 24 , nr. 1 . - P. 59-70 . - doi : 10.1093/imamat/24.1.59 .
  5. Radovanovic, Miloš; Nanopoulos, Alexandros; Ivanovic, Mirjana. Hub-uri în spațiu: cei mai apropiați vecini populari în date cu dimensiuni mari  //  Journal of Machine Learning Research  : jurnal. - 2010. - Vol. 11 . - P. 2487-2531 .
  6. CUNOAȘTE INTUIT | Prelegere | Cea mai abruptă metodă de coborâre. Metoda Davidon-Fletcher-Powell. Problema râpei. Problema multi-extremității . Preluat la 26 aprilie 2022. Arhivat din original la 27 decembrie 2016.
  7. Joel H. Spencer (1994), Zece Lectures on the Probabilistic Method , SIAM , p. 4, ISBN 978-0-89871-325-1 
  8. Aubrey D.N.J. D.E. Grey. Numărul cromatic al planului este de cel puțin 5  // math.CO. — 2018. Arhivat la 12 iulie 2018.