Metoda gradientului proximal [1] este o generalizare a proiecției utilizată pentru a rezolva probleme de programare convexă nediferențiabilă .
Multe probleme interesante pot fi formulate ca probleme de programare convexe ale formei
unde sunt funcții convexe , definite ca mapări , unde unele dintre funcții sunt nediferențiabile, ceea ce exclude tehnicile obișnuite de optimizare netedă, cum ar fi metoda cea mai abruptă de coborâre sau metoda gradientului conjugat etc., se pot folosi în schimb metodele gradientului proximal. Aceste metode funcționează prin împărțire, astfel încât funcțiile să fie utilizate individual, permițând dezvoltarea unor algoritmi mai ușor de implementat. Ele sunt numite proximale ( eng. proximal , cea mai apropiată), deoarece fiecare funcție non-smooth dintre este implicată în proces prin operatorul de proximitate. Algoritmul iterativ de filtrare soft threshold [2] , proiecția Landweber , proiecția gradientului , proiecțiile alternante , metoda direcțiilor alternante ale multiplicatorilor , metoda divizărilor alternante ale lui Bragman sunt cazuri speciale de algoritmi proximali [3] . Pentru o discuție despre metodele de gradient proximal din perspectiva teoriei învățării statistice și a aplicațiilor acestei teorii, vezi Metode de gradient proximal pentru învățarea automată .
Fie , spațiu euclidian -dimensional , domeniul funcției . Să presupunem că este o submulțime convexă nevidă a mulțimii . Apoi funcția indicator a setului este definită ca
-norma este definită caDistanța de la până este definită ca
Dacă este închis și convex, proiecția către mulțime este singurul punct astfel încât .
Subdiferenţialul unei funcţii într-un punct este dat de expresia
Un algoritm de optimizare convex utilizat pe scară largă este proiecția la mulțimi convexe . Acest algoritm este folosit pentru a detecta/sintetiza un semnal care satisface mai multe constrângeri convexe simultan. Fie o funcție indicator pe o mulțime convexă închisă nevide care modelează o constrângere. Aceasta reduce problema la problema fezabilității convexe (accesibilitatea), în care trebuie să găsim o soluție conținută în intersecția tuturor mulțimilor convexe . În metoda de proiecție la seturi convexe, fiecare set este asociat cu proiectorul său . Astfel, la fiecare iterație se recalculează conform formulei
Cu toate acestea, dincolo de astfel de sarcini, proiectoarele nu sunt potrivite și sunt necesari operatori de o formă mai generală. Dintre diferitele generalizări existente ale noțiunii de proiector convex, operatorii de proximitate sunt cei mai potriviți pentru astfel de scopuri.
Operatorul de proximitate al unei funcții convexeîntr-un puncteste definit ca singura soluție
și este notat ca .
Rețineți că, în cazul în care este funcția indicator a unui set convex
ceea ce arată că operatorul de proximitate este într-adevăr o generalizare a proiectorului.
Operatorul de proximitate al funcției este descris de includere
Dacă este diferențiabilă, atunci ecuația de mai sus se reduce la
Cazuri particulare de metode de gradient proximal sunt