Metoda gradientului proximal

Metoda gradientului proximal [1] este o generalizare a proiecției utilizată pentru a rezolva probleme de programare convexă  nediferențiabilă .

Multe probleme interesante pot fi formulate ca probleme de programare convexe ale formei

unde  sunt funcții convexe , definite ca mapări , unde unele dintre funcții sunt nediferențiabile, ceea ce exclude tehnicile obișnuite de optimizare netedă, cum ar fi metoda cea mai abruptă de coborâre sau metoda gradientului conjugat etc., se pot folosi în schimb metodele gradientului proximal. Aceste metode funcționează prin împărțire, astfel încât funcțiile să fie utilizate individual, permițând dezvoltarea unor algoritmi mai ușor de implementat. Ele sunt numite proximale ( eng. proximal , cea mai apropiată), deoarece fiecare funcție non-smooth dintre este implicată în proces prin operatorul de proximitate. Algoritmul iterativ de filtrare soft threshold [2] , proiecția Landweber , proiecția gradientului , proiecțiile alternante , metoda direcțiilor alternante ale multiplicatorilor , metoda divizărilor alternante ale lui Bragman sunt cazuri speciale de algoritmi proximali [3] . Pentru o discuție despre metodele de gradient proximal din perspectiva teoriei învățării statistice și a aplicațiilor acestei teorii, vezi Metode de gradient proximal pentru învățarea automată .  

Notație și terminologie

Fie , spațiu euclidian -dimensional , domeniul funcției . Să presupunem că este o submulțime convexă nevidă a mulțimii . Apoi funcția indicator a setului este definită ca

-norma este definită ca

Distanța de la până este definită ca

Dacă este închis și convex, proiecția către mulțime este singurul punct astfel încât .

Subdiferenţialul unei funcţii într-un punct este dat de expresia

Proiecție la mulțimi convexe

Un algoritm de optimizare convex utilizat pe scară largă este proiecția la mulțimi convexe . Acest algoritm este folosit pentru a detecta/sintetiza un semnal care satisface mai multe constrângeri convexe simultan. Fie o funcție indicator pe o mulțime convexă închisă nevide care modelează o constrângere. Aceasta reduce problema la problema fezabilității convexe (accesibilitatea), în care trebuie să găsim o soluție conținută în intersecția tuturor mulțimilor convexe . În metoda de proiecție la seturi convexe, fiecare set este asociat cu proiectorul său . Astfel, la fiecare iterație se recalculează conform formulei

Cu toate acestea, dincolo de astfel de sarcini, proiectoarele nu sunt potrivite și sunt necesari operatori de o formă mai generală. Dintre diferitele generalizări existente ale noțiunii de proiector convex, operatorii de proximitate sunt cei mai potriviți pentru astfel de scopuri.

Definiție

Operatorul de proximitate al unei funcții convexeîntr-un puncteste definit ca singura soluție

și este notat ca .

Rețineți că, în cazul în care este funcția indicator a unui set convex

ceea ce arată că operatorul de proximitate este într-adevăr o generalizare a proiectorului.

Operatorul de proximitate al funcției este descris de includere

Dacă este diferențiabilă, atunci ecuația de mai sus se reduce la

Exemple

Cazuri particulare de metode de gradient proximal sunt

Vezi și

Note

  1. engleză.  Proximal = cel mai apropiat
  2. Daubechies, Defrise, De Mol, 2004 , p. 1413–1457
  3. ^ Patrick L. Combettes  Metodele proximale sunt discutate în detaliu

Literatură

Link -uri