O matrice pseudo-inversă este o generalizare a conceptului de matrice inversă în algebra liniară . Pseudo-inversul unei matrice este notat cu .
Conceptul de operatori integratori pseudoinversi a fost introdus pentru prima dată în 1903 de Fredholm . Cea mai cunoscută este pseudo-conversia Moore-Penrose, care a fost descrisă independent de Eliakim Moore [1] în 1920 și Roger Penrose [2] în 1955 ; afirmația că o matrice pseudoinversă există și este unică pentru orice matrice peste numerele reale și complexe se numește teorema Moore-Penrose .
Un invers generalizat esteo pseudo-inversie care satisface condiții mai stricte . Pseudo-inversia poate fi înțeleasă ca soluția celei mai bune probleme de aproximare (prin metoda celor mai mici pătrate cu varianta de regularizare limitativă) pentru sistemul corespunzător de ecuații liniare . Matricea pseudo-inversa poate fi calculată folosind descompunerea valorii singulare a matricei.
se numește matrice pseudo-inversă pentru o matrice dacă îndeplinește următoarele criterii:
Aici este matricea conjugată Hermitiană M (pentru matrice peste câmpul numerelor reale ).
Există o modalitate echivalentă de a specifica o matrice pseudo-inversă în ceea ce privește limita inverselor ( regularizarea Tikhonov ):
,unde este matricea de identitate. Această limită există chiar dacă nu este definită.
Dacă coloanele unei matrice sunt dependente liniar , atunci matricea este inversabilă. În acest caz, matricea pseudo-inversă este dată de formula:
.Dacă coloanele sunt liniar independente (ceea ce este adevărat pentru matrice pătrată nesingulară), atunci pseudo-inversia este aceeași cu inversiunea:
.Dacă și sunt astfel încât produsul este definit și:
apoi
.Pseudo-inversarea poate fi aplicată atât la scalari cât și la vectori. Aceasta implică faptul că ele sunt tratate ca matrici de dimensiunea corespunzătoare. Pseu-inversul unui scalar este zero dacă este zero, iar inversul în caz contrar:
Pseudo-inversul pentru vectorul zero este vectorul zero transpus. Pseudo-inversul pentru un vector diferit de zero este vectorul transpus conjugat împărțit la pătratul lungimii sale:
Pentru a dovedi, este suficient să verificăm că aceste mărimi satisfac definiția pseudoinverselor.
Dacă există, atunci din egalitate:
ar trebui să
care dă naştere conceptului de pseudo-inversare
.Fie rangul unei matrice de dimensiune . Atunci poate fi reprezentat ca , unde B este o matrice de dimensiune cu coloane liniar independente și este o matrice de dimensiune cu rânduri liniar independente. Apoi:
.Dacă are un rang de linie completă, adică , atunci matricea de identitate poate fi aleasă și formula se reduce la . În mod similar, dacă are un rang de coloană completă, adică , atunci .
Cel mai simplu mod de calcul de a obține o matrice pseudo-inversă este utilizarea unei descompunere a valorii singulare .
Dacă este o descompunere a valorii singulare , atunci . Pentru o matrice diagonală precum , pseudoinversul se obține din aceasta prin înlocuirea fiecărui element diferit de zero de pe diagonală cu inversul său.
Există abordări optimizate pentru calcularea pseudoinversului pentru matricele bloc.
Uneori, volumul de calcule pentru găsirea unei matrice pseudo-inversă poate fi redus dacă se cunoaște pseudo-inversa pentru o matrice similară. În special, dacă o matrice similară diferă de cea inițială una câte una modificată, adăugată sau ștersă coloană sau rând, există algoritmi cumulativi care pot folosi relația dintre matrice.
Pseudo-inversia este strâns legată de metoda celor mai mici pătrate (LSM) pentru un sistem de ecuații liniare [3] .
În această metodă, problema rezolvării sistemului dat este înlocuită cu problema minimizării normei euclidiene la pătrat a discrepanței . În practică, LSM este folosit de obicei atunci când sistemul original este inconsecvent, dar mai jos vom lua în considerare cazul când acest sistem este compatibil.
Soluția generală a unui sistem neomogen poate fi reprezentată ca suma unei soluții particulare a unui sistem neomogen și soluția generală a sistemului omogen corespunzător .
Lema: Dacă există, atunci soluția generală este întotdeauna reprezentabilă ca sumă a soluției pseudoinverse a sistemului neomogen și a soluției sistemului omogen:
Dovada:
. |
Aici vectorul este arbitrar (până la dimensiune). Ceilalți doi termeni au o matrice pseudo-inversă . Rescriind-o în forma , aducem expresia la forma:
Primul termen este o soluție pseudo-inversă. În ceea ce privește metoda celor mai mici pătrate, este , care oferă norma euclidiană minimă pentru reziduu. Următorul termen oferă o soluție sistemului omogen , deoarece este operatorul de proiecție pe imaginea operatorului și, în consecință, este operatorul de proiecție pe nucleul operatorului .