Hessianul unei funcții este o formă pătratică simetrică [1] care descrie comportamentul unei funcții în al doilea ordin.
Pentru o funcție de două ori diferențiabilă într-un punct
sau
unde (sau ) și funcția este definită pe spațiu real -dimensional (sau spațiu complex ) cu coordonate (sau ). În ambele cazuri, Hessianul este o formă pătratică dată pe spațiul tangent , care nu se modifică la transformările liniare ale variabilelor. Hessianul este adesea numit și determinantul unei matrice, vezi mai jos.
Matricea acestei forme pătratice este formată din derivatele a doua parțiale ale funcției. Dacă toate derivatele există, atunci
Determinantul acestei matrice se numește determinant Hessian sau pur și simplu Hessian .
Matricele Hessian sunt utilizate în probleme de optimizare prin metoda lui Newton . Calculul complet al matricei Hessian poate fi dificil, astfel încât algoritmi cvasi-newtonieni au fost dezvoltați pe baza expresiilor aproximative pentru matricea Hessian. Cel mai faimos dintre ele este algoritmul Broyden-Fletcher-Goldfarb-Shanno .
Derivatele mixte ale funcției f sunt elementele matricei Hessian care nu se află pe diagonala principală . Dacă sunt continue, atunci ordinea diferențierii nu este importantă:
Acest lucru poate fi scris și ca
În acest caz, matricea Hessiană este simetrică .
Dacă gradientul ( derivata sa vectorială ) este zero la un moment dat , atunci acest punct se numește critic . O condiție suficientă pentru existența unui extremum în acest punct este caracterul definit al semnului f Hessian (înțeles în acest caz ca formă pătratică), și anume:
Dacă este o funcție vectorială , adică
atunci derivatele sale parțiale a doua formează nu o matrice, ci un tensor de rang 3, care poate fi considerat ca o matrice de matrici hessiene:
La , acest tensor degenerează în matricea hessiană obișnuită.
La rezolvarea problemei găsirii unui extremum condiționat al unei funcții cu restricții
unde , , pentru a verifica condiții suficiente pentru un extremum, se poate folosi așa-numitul Hessian mărginit al funcției Lagrange , care va avea forma [2]
Verificarea unor condiții extreme suficiente constă în calcularea semnelor determinanților unui anumit set de submatrici ale hessianului mărginit. Și anume, dacă există astfel încât și
pentru , atunci funcția are un minim strict condiționat în punctul . Dacă
pentru , atunci în punctul funcția are un maxim strict condiționat [3] .
Conceptul a fost introdus de Ludwig Otto Hesse ( 1844 ), care a folosit un alt nume. Termenul „hessian” a fost inventat de James Joseph Sylvester .
Calcul diferenţial | |||||||
---|---|---|---|---|---|---|---|
Principal | |||||||
vederi private | |||||||
Operatori diferențiali ( în diferite coordonate ) |
| ||||||
subiecte asemănătoare |