Matricea pseudo-inversa

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 19 iulie 2021; verificările necesită 2 modificări .

O matrice pseudo-inversă  este o generalizare a conceptului de matrice inversă în algebra liniară . Pseudo-inversul unei matrice este notat cu .

Conceptul de operatori integratori pseudoinversi a fost introdus pentru prima dată în 1903 de Fredholm . Cea mai cunoscută este pseudo-conversia Moore-Penrose, care a fost descrisă independent de Eliakim Moore [1] în 1920 și Roger Penrose [2] în 1955 ; afirmația că o matrice pseudoinversă există și este unică pentru orice matrice peste numerele reale și complexe se numește teorema Moore-Penrose .

Un invers generalizat esteo pseudo-inversie care satisface condiții mai stricte .  Pseudo-inversia poate fi înțeleasă ca soluția celei mai bune probleme de aproximare (prin metoda celor mai mici pătrate cu varianta de regularizare limitativă) pentru sistemul corespunzător de ecuații liniare . Matricea pseudo-inversa poate fi calculată folosind descompunerea valorii singulare a matricei.

Definiție

se numește matrice pseudo-inversă pentru o matrice dacă îndeplinește următoarele criterii:

  1. ;
  2. ( este o inversare slabă într-un semigrup multiplicativ);
  3. (aceasta înseamnă că  este o matrice hermitiană );
  4. (  este de asemenea o matrice hermitiana).

Aici  este matricea conjugată Hermitiană M (pentru matrice peste câmpul numerelor reale ).

Există o modalitate echivalentă de a specifica o matrice pseudo-inversă în ceea ce privește limita inverselor ( regularizarea Tikhonov ):

,

unde  este matricea de identitate. Această limită există chiar dacă nu este definită.

Proprietăți

Ocazii speciale

Dacă coloanele unei matrice sunt dependente liniar , atunci matricea este inversabilă. În acest caz, matricea pseudo-inversă este dată de formula:

.

Dacă coloanele sunt liniar independente (ceea ce este adevărat pentru matrice pătrată nesingulară), atunci pseudo-inversia este aceeași cu inversiunea:

.

Dacă și sunt astfel încât produsul este definit și:

apoi

.

Pseudo-inversarea poate fi aplicată atât la scalari cât și la vectori. Aceasta implică faptul că ele sunt tratate ca matrici de dimensiunea corespunzătoare. Pseu-inversul unui scalar  este zero dacă  este zero, iar inversul în caz contrar:

Pseudo-inversul pentru vectorul zero este vectorul zero transpus. Pseudo-inversul pentru un vector diferit de zero este vectorul transpus conjugat împărțit la pătratul lungimii sale:

Pentru a dovedi, este suficient să verificăm că aceste mărimi satisfac definiția pseudoinverselor.

Origine

Dacă există, atunci din egalitate:

ar trebui să

care dă naştere conceptului de pseudo-inversare

.

Calcul

Fie  rangul unei matrice de dimensiune . Atunci poate fi reprezentat ca , unde B  este o matrice de dimensiune cu coloane liniar independente și  este o matrice de dimensiune cu rânduri liniar independente. Apoi:

.

Dacă are un rang de linie completă, adică , atunci matricea de identitate poate fi aleasă și formula se reduce la . În mod similar, dacă are un rang de coloană completă, adică , atunci .

Cel mai simplu mod de calcul de a obține o matrice pseudo-inversă este utilizarea unei descompunere a valorii singulare .

Dacă  este o descompunere a valorii singulare , atunci . Pentru o matrice diagonală precum , pseudoinversul se obține din aceasta prin înlocuirea fiecărui element diferit de zero de pe diagonală cu inversul său.

Există abordări optimizate pentru calcularea pseudoinversului pentru matricele bloc.

Uneori, volumul de calcule pentru găsirea unei matrice pseudo-inversă poate fi redus dacă se cunoaște pseudo-inversa pentru o matrice similară. În special, dacă o matrice similară diferă de cea inițială una câte una modificată, adăugată sau ștersă coloană sau rând, există algoritmi cumulativi care pot folosi relația dintre matrice.

Aplicație

Pseudo-inversia este strâns legată de metoda celor mai mici pătrate (LSM) pentru un sistem de ecuații liniare [3] .

În această metodă, problema rezolvării sistemului dat este înlocuită cu problema minimizării normei euclidiene la pătrat a discrepanței . În practică, LSM este folosit de obicei atunci când sistemul original este inconsecvent, dar mai jos vom lua în considerare cazul când acest sistem este compatibil.

Soluția generală a unui sistem neomogen poate fi reprezentată ca suma unei soluții particulare a unui sistem neomogen și soluția generală a sistemului omogen corespunzător .

Lema: Dacă există, atunci soluția generală este întotdeauna reprezentabilă ca sumă a soluției pseudoinverse a sistemului neomogen și a soluției sistemului omogen:

Dovada:

.

Aici vectorul este arbitrar (până la dimensiune). Ceilalți doi termeni au o matrice pseudo-inversă . Rescriind-o în forma , aducem expresia la forma:

Primul termen este o soluție pseudo-inversă. În ceea ce privește metoda celor mai mici pătrate, este , care oferă norma euclidiană minimă pentru reziduu. Următorul termen oferă o soluție sistemului omogen , deoarece  este operatorul de proiecție pe imaginea operatorului și, în consecință,  este operatorul de proiecție pe nucleul operatorului .

Literatură

  1.   E. H. Moore: Despre reciproca matricei algebrice generale. Buletinul Societății Americane de Matematică 26, 394-395 (1920) 7.pdf
  2.   Roger Penrose: O inversă generalizată pentru matrice. Proceedings of the Cambridge Philosophical Society 51, 406-413 (1955)
  3.   Roger Penrose: Despre cea mai bună soluție aproximativă a ecuațiilor matriceale liniare. Proceedings of the Cambridge Philosophical Society 52, 17-19 (1956)
  4.   Albert A.: Regresie, pseudo-inversie și estimare recursivă. transl. din engleza. Moscova, „Nauka”, 224 p. (1977)
  5.   Beklemishev D.V.: ​​Capitole suplimentare de algebră liniară. Moscova, Știință. (1983)