Coordonarea coborârii
Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de
versiunea revizuită pe 16 aprilie 2022; verificarea necesită
1 editare .
Coborârea coordonatelor este un algoritm de optimizare care minimizează secvențial o funcție de-a lungul direcțiilor de coordonate. La fiecare iterație, algoritmul determină o variabilă de coordonate sau un bloc de coordonate prin intermediul unei reguli de selecție a coordonatelor, apoi minimizează exact sau aproximativ peste hiperplanul de coordonate corespunzător în timp ce fixează alte coordonate sau blocuri de coordonate. La iterația curentă, o căutare liniară de-a lungul direcției de coordonate poate fi efectuată pentru a găsi o dimensiune adecvată a pasului. Coborarea coordonatelor poate fi aplicată atât în cazul diferențiabil, cât și în cazul contextului când derivatele nu sunt calculate.
Descriere
Coborarea coordonatelor se bazează pe ideea că minimizarea unei funcții a mai multor variabile se poate face prin minimizarea de-a lungul unei direcții la un moment dat, de exemplu prin rezolvarea unei singure probleme de optimizare a variabilei (sau cel puțin a unei probleme mai simple) într-o buclă [1] . În cel mai simplu caz de coborare ciclică a coordonatelor , algoritmul iterează peste direcțiile coordonatelor câte una pe iterație, minimizând funcția obiectiv peste fiecare coordonată la un moment dat. Adică pornind de la valorile inițiale
,
iterația determină din prin rezolvarea iterativă a problemelor de optimizare dintr-o variabilă
[2]
pentru fiecare variabilă vectorială de la 1 la .
Astfel, algoritmul începe cu o aproximare inițială a minimului local al funcției și obține o succesiune de vectori în mod iterativ.
Când se efectuează o căutare liniară la fiecare iterație, obținem
Se poate arăta că această secvență are proprietăți de convergență similare metodei de coborâre abruptă. Lipsa de îmbunătățire a funcției obiectiv după următorul ciclu de căutări liniare de-a lungul direcțiilor de coordonate indică faptul că a fost atins un punct staționar.
Funcționarea algoritmului este prezentată mai jos.
Caz diferențiabil
În cazul diferențierii continue a funcției F , algoritmul de coborare a coordonatelor poate fi rezumat ca [1] :
- Alegem vectorul initial x .
- Până la atingerea unui nivel de convergență sau la un număr fix de iterații:
- Alegeți un indice i din intervalul de la 1 la n .
- Alegem dimensiunea pasului α .
- Inlocuim cu .
Pasul poate fi ales în mai multe moduri, de exemplu, prin rezolvarea unei probleme de minimizare (adică prin minimizarea F cu variabile fixe cu excepția lui ), sau prin căutare liniară tradițională [1] .
Restricții
Coborârea coordonată are două probleme. Una dintre ele este prezența unei funcții neregulate a mai multor variabile. Figura arată că iterațiile de coborâre de coordonate pot rula într-un punct non-staționar dacă curbele de nivel ale funcției nu sunt netede. Să presupunem că algoritmul a ajuns în punctul (-2, -2) . Apoi există două direcții paralele cu axele de-a lungul cărora ar trebui făcut următorul pas. Sunt afișate cu săgeți roșii. Cu toate acestea, orice pas în aceste două direcții va duce la o creștere a valorii funcției (se presupune că problema de minimizare este rezolvată), astfel încât algoritmul nu va face un singur pas, deși doi pași împreună ar aduce algoritm mai aproape de optim. Deși acest exemplu arată că coborârea coordonatelor nu conduce neapărat la o soluție optimă, este posibil să se arate convergența formală în condiții normale [3] .
O altă problemă este dificultatea paralelizării. Deoarece natura coborârii coordonatelor este de a bucla peste direcții și de a minimiza o funcție de-a lungul fiecărei direcții de coordonate, coborârea de coordonate nu este un candidat evident pentru paralelizare. Cercetări recente au arătat că paralelizarea poate fi folosită pentru coborârea coordonată cu unele trucuri speciale [4] [5] [6] .
Aplicații
Algoritmii de coborare în coordonate sunt populari pentru simplitatea lor, dar aceeași proprietate încurajează cercetătorii să-i ignore în favoarea unor metode mai interesante (mai complexe) [1] . Aplicațiile timpurii ale optimizării coborârii coordonate au fost în domeniul tomografiei computerizate [7] , unde metoda a arătat o convergență rapidă [8] și a fost folosită pentru a reconstrui imagini de tomografie computerizată elicoidal multistrat [9] . Algoritmul de coborare a coordonatelor ciclice a fost aplicat în predicția structurii proteinei [10] . Mai mult, a existat un interes din ce în ce mai mare pentru aplicarea coborârii coordonate odată cu apariția problemelor la scară largă în învățarea automată , în care coborârea coordonatelor s-a dovedit a fi competitivă cu alte metode atunci când este aplicată la probleme precum învățarea automată a vectorului de suport liniar . 11] (vezi LIBLINEAR ) și extinderea matricei nenegative [12] . Metodele sunt atractive pentru problemele în care calculul gradientului nu este fezabil, poate pentru că datele necesare sunt distribuite prin rețele de calculatoare [13] .
Vezi și
Note
- ↑ 1 2 3 4 Wright, 2015 , p. 3–34.
- ↑ Copie arhivată . Preluat la 6 februarie 2022. Arhivat din original la 6 februarie 2022. (nedefinit)
- ↑ Spall, 2012 , p. 187–208.
- ↑ Zheng, Saquib, Sauer, Bouman, 2000 , p. 1745–1759
- ↑ Fessler, Ficaro, Clinthorne, Lange, 1997 , p. 166–175.
- ↑ Wang, Sabne, Kisner, 2016 , p. 2:1–2:12.
- ↑ Sauer, Bouman, 1993 , p. 534–548.
- ↑ Yu, Thibault, Bouman, Sauer, 2011 , p. 161–175.
- ↑ Thibault, Sauer, Bouman, Hsieh, 2007 , p. 4526–4544.
- ↑ Canutescu, Dunbrack, 2003 , p. 963–72.
- ↑ Hsieh, Chang, Lin, Keerthi, 2008 , p. 408.
- ↑ Hsieh, Dhillon, 2011 , p. 1064.
- ↑ Nesterov, 2012 , p. 341–362.
Literatură
- Stephen J. Wright. Algoritmi de coborare a coordonatelor // Programare matematică. - 2015. - T. 151 , nr. 1 . - doi : 10.1007/s10107-015-0892-3 . - arXiv : 1502.04759 .
- Spall JC Procesul de balansoar ciclic pentru optimizare și identificare // Journal of Optimization Theory and Applications. - 2012. - T. 154 , nr. 1 . - doi : 10.1007/s10957-012-0001-1 .
- Zheng J., Saquib SS, Sauer K., Bouman CA Algoritmi de tomografie bayesiană paraleliză cu convergență rapidă, garantată // Tranzacții IEEE privind procesarea imaginilor. - 2000. - T. 9 , nr. 10 . — ISSN 1057-7149 . - doi : 10.1109/83.869186 . - Cod biblic . — PMID 18262913 .
- Fessler JA, Ficaro EP, Clinthorne NH, Lange K. Grouped-coordinate ascent algorithms for penalized-likelihood transmission image reconstruction // IEEE Transactions on Medical Imaging. - 1997. - T. 16 , nr. 2 . — ISSN 0278-0062 . - doi : 10.1109/42.563662 . — PMID 9101326 .
- Xiao Wang, Amit Sabne, Sherman Kisner, Anand Raghunathan, Charles Bouman, Samuel Midkiff. Reconstrucție de imagine bazată pe modele de înaltă performanță . — Actele celui de-al 21-lea Simpozion ACM SIGPLAN privind principiile și practica programării paralele. — New York, NY, SUA: ACM, 2016. — ISBN 9781450340922 . - doi : 10.1145/2851141.2851163 .
- Ken Sauer, Charles Bowman. O strategie de actualizare locală pentru reconstrucția iterativă din proiecții // Tranzacții IEEE privind procesarea semnalului. - 1993. - Februarie ( vol. 41 , numărul 2 ). - doi : 10.1109/78.193196 . - Cod biblic .
- Zhou Yu, Jean-Baptiste Thibault, Charles Bouman, Ken Sauer, Jiang Hsieh. Reconstrucție CT cu raze X rapidă bazată pe model folosind optimizarea ICD neomogene din punct de vedere spațial // Tranzacții IEEE privind procesarea imaginilor. - 2011. - ianuarie ( vol. 20 , numărul 1 ). - doi : 10.1109/TIP.2010.2058811 . - Cod biblic . — PMID 20643609 .
- Jean-Baptiste Thibault, Ken Sauer, Charles Bouman, Jiang Hsieh. O abordare statistică tridimensională pentru îmbunătățirea calității imaginii pentru CT elicoidal multi-slice // Fizica medicală. - 2007. - Noiembrie ( vol. 34 , numărul 11 ). - doi : 10.1118/1.2789499 . - Cod . — PMID 18072519 .
- Canutescu AA, Dunbrack RL Cyclic coordonate descent: A robotics algorithm for protein loop closure. // Știința proteinelor. - 2003. - T. 12 , nr. 5 . - doi : 10.1110/ps.0242703 . — PMID 12717019 .
- Hsieh CJ, Chang KW, Lin CJ, Keerthi SS, Sundararajan S. A dual coordinate descent method for large-scale linear SVM // Proceedings of the 25th international Conference on Machine Learning - ICML '08. - 2008. - ISBN 9781605582054 . - doi : 10.1145/1390156.1390208 .
- Hsieh CJ, Dhillon IS Metode rapide de coborare a coordonatelor cu selecție variabilă pentru factorizarea matriceală nenegativă // Proceedings of the 17th ACM SIGKDD international Conference on Knowledge discovery and data mining - KDD '11 . - 2011. - ISBN 9781450308137 . - doi : 10.1145/2020408.2020577 .
- Yurii Nesterov. Eficiența metodelor de coborare în coordonate pe probleme de optimizare la scară uriașă // SIAM J. Optim.. - 2012. - V. 22 , nr. 2 . - doi : 10.1137/100802001 .
- Bezdek JC, Hathaway RJ, Howard RE, Wilson CA, Windham MP Analiza de convergență locală a unei versiuni variabile grupate a coborârii coordonate // Journal of Optimization Theory and Applications. - Kluwer Academic / Plenum Publishers, 1987. - V. 54 , nr. 3 . - P. 471-477. - doi : 10.1007/BF00940196 .
- Dimitri P. Bertsekas,. programare neliniară. - A doua editie. - Belmont, Massachusetts: Athena Scientific, 1999. - ISBN 1-886529-00-0 .
- Zhiquan Luo, Tseng P. Despre convergența metodei de coborâre a coordonatelor pentru minimizarea diferențiabilă convexă // Journal of Optimization Theory and Applications. - Kluwer Academic / Plenum Publishers, 1992. - T. 72 , nr. 1 . — P. 7–35. - doi : 10.1007/BF00939948 . .
- Tong Tong Wu, Kenneth Lange. Algoritmi de coborare coordonate pentru regresia penalizată Lasso // The Annals of Applied Statistics. - Institutul de Statistică Matematică, 2008. - Vol. 2 , nr. 1 . - P. 224-244. - doi : 10.1214/07-AOAS147 . - arXiv : 0803.3876 . .
- Peter Richtarik, Martin Takac. Complexitatea de iterație a metodelor de coborare aleatorie cu coordonate bloc pentru minimizarea unei funcții compozite // Programare matematică. - Springer, aprilie 2011. - Vol. 144 , nr. 1–2 . — P. 1–38. - doi : 10.1007/s10107-012-0614-z . - arXiv : 1107.2848 .
- Peter Richtarik, Martin Takac. Metode de coborare a coordonatelor paralele pentru optimizarea datelor mari // ArXiv:1212.0873. - decembrie 2012. - arXiv : 1212.0873 .