Funcții Hessian

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 24 decembrie 2021; verificările necesită 2 modificări .

Hessianul unei funcții este o formă pătratică  simetrică [1] care descrie comportamentul unei funcții în al doilea ordin.

Pentru o funcție de două ori diferențiabilă într-un punct

sau

unde (sau ) și funcția este definită pe spațiu real -dimensional (sau spațiu complex ) cu coordonate (sau ). În ambele cazuri, Hessianul este o formă pătratică dată pe spațiul tangent , care nu se modifică la transformările liniare ale variabilelor. Hessianul este adesea numit și determinantul unei matrice, vezi mai jos.

matrice hessiană

Matricea acestei forme pătratice este formată din derivatele a doua parțiale ale funcției. Dacă toate derivatele există, atunci

Determinantul acestei matrice se numește determinant Hessian sau pur și simplu Hessian .

Matricele Hessian sunt utilizate în probleme de optimizare prin metoda lui Newton . Calculul complet al matricei Hessian poate fi dificil, astfel încât algoritmi cvasi-newtonieni au fost dezvoltați pe baza expresiilor aproximative pentru matricea Hessian. Cel mai faimos dintre ele este algoritmul Broyden-Fletcher-Goldfarb-Shanno .

Simetria matricei Hesse

Derivatele mixte ale funcției f  sunt elementele matricei Hessian care nu se află pe diagonala principală . Dacă sunt continue, atunci ordinea diferențierii nu este importantă:

Acest lucru poate fi scris și ca

În acest caz, matricea Hessiană este simetrică .

Puncte critice ale unei funcții

Dacă gradientul ( derivata sa vectorială ) este zero la un moment dat , atunci acest punct se numește critic . O condiție suficientă pentru existența unui extremum în acest punct este caracterul definit al semnului f Hessian (înțeles în acest caz ca formă pătratică), și anume:

Variații și generalizări

Funcții vectoriale

Dacă  este o funcție vectorială , adică

atunci derivatele sale parțiale a doua formează nu o matrice, ci un tensor de rang 3, care poate fi considerat ca o matrice de matrici hessiene:

La , acest tensor degenerează în matricea hessiană obișnuită.

Banded Hessian

La rezolvarea problemei găsirii unui extremum condiționat al unei funcții cu restricții

unde , , pentru a verifica condiții suficiente pentru un extremum, se poate folosi așa-numitul Hessian mărginit al funcției Lagrange , care va avea forma [2]

Verificarea unor condiții extreme suficiente constă în calcularea semnelor determinanților unui anumit set de submatrici ale hessianului mărginit. Și anume, dacă există astfel încât și

pentru , atunci funcția are un minim strict condiționat în punctul . Dacă

pentru , atunci în punctul funcția are un maxim strict condiționat [3] .

Istorie

Conceptul a fost introdus de Ludwig Otto Hesse ( 1844 ), care a folosit un alt nume. Termenul „hessian” a fost inventat de James Joseph Sylvester .

Vezi și

Note

  1. Hessian . Consultat la 2 aprilie 2016. Arhivat din original pe 15 aprilie 2016.
  2. ^ Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Statul Iowa (7 octombrie 2004). Consultat la 14 aprilie 2021. Arhivat din original pe 19 aprilie 2021.
  3. Neudecker, Heinz. Calcul diferențial matriceal cu aplicații în statistică și econometrie / Heinz Neudecker, Jan R. Magnus. - New York: John Wiley & Sons , 1988. - P. 136. - ISBN 978-0-471-91516-4 .

Link -uri