Matricea pseudo-inversa

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 19 iulie 2021; verificările necesită 2 modificări .

O matrice pseudo-inversă este o generalizare a conceptului de matrice inversă în algebra liniară . Pseudo-inversul unei matrice este notat cu . $A$ $A^+$

Conceptul de operatori integratori pseudoinversi a fost introdus pentru prima dată în 1903 de Fredholm . Cea mai cunoscută este pseudo-conversia Moore-Penrose, care a fost descrisă independent de Eliakim Moore [1] în 1920 și Roger Penrose [2] în 1955 ; afirmația că o matrice pseudoinversă există și este unică pentru orice matrice peste numerele reale și complexe se numește teorema Moore-Penrose .

Un invers generalizat esteo pseudo-inversie care satisface condiții mai stricte . Pseudo-inversia poate fi înțeleasă ca soluția celei mai bune probleme de aproximare (prin metoda celor mai mici pătrate cu varianta de regularizare limitativă) pentru sistemul corespunzător de ecuații liniare . Matricea pseudo-inversa poate fi calculată folosind descompunerea valorii singulare a matricei.

Definiție

$A^+$ se numește matrice pseudo-inversă pentru o matrice dacă îndeplinește următoarele criterii: $A$

$AA^+A = A$ ;
$A^+AA^+ = A^+$ ( este o inversare slabă într-un semigrup multiplicativ); $A^+$
$(AA^+)^* = AA^+$ (aceasta înseamnă că este o matrice hermitiană ); $AA^+$
$(A^+A)^* = A^+A$ ( este de asemenea o matrice hermitiana). $A^+A$

Aici este matricea conjugată Hermitiană M (pentru matrice peste câmpul numerelor reale ). $M^*$ $M^* = M^T$

Există o modalitate echivalentă de a specifica o matrice pseudo-inversă în ceea ce privește limita inverselor ( regularizarea Tikhonov ):

A^+ = \lim_{\delta \to +0} (A^* A + \delta I)^{-1} A^* = \lim_{\delta \to +0} A^* (AA^* + \delta I)^{-1}

unde este matricea de identitate. Această limită există chiar dacă nu este definită. $eu$ $(AA^*)^{-1}$ $(A^* A)^{-1}$

Proprietăți

Pseudo -inversie este involutivă (adică această operație este inversă față de ea însăși): $(A^+)^+ = A$ .
Pseudo-inversie comută cu transpoziție, conjugare și conjugare hermitiană : $(A^T)^+ = (A^+)^T$ , , .
$(\overline{A})^+ = \overline{A^+}$
$(A^*)^+ = (A^+)^*$
Produsul pseudoinvers al unei matrice și al unui scalar este egal cu produsul corespunzător al unei matrice și reciproca acesteia : $A$ $\alfa$ $A^+$ $\alpha^{-1}$ $(\alpha A)^+ = \alpha^{-1} A^+$ , pentru . $\alpha \neq 0$
Dacă matricea pseudo-inversa pentru este deja cunoscută, poate fi folosită pentru a calcula : $A^*A$ $A^+$ $A^+ = (A^*A)^+A^*$ .
În mod similar, dacă matricea este deja cunoscută: $(AA^*)^+$ $A^+ = A^*(AA^*)^+$ .

Ocazii speciale

Dacă coloanele unei matrice sunt dependente liniar , atunci matricea este inversabilă. În acest caz, matricea pseudo-inversă este dată de formula: $A$ $A^* A$

A^+ = (A^* A)^{-1} A^*

Dacă coloanele sunt liniar independente (ceea ce este adevărat pentru matrice pătrată nesingulară), atunci pseudo-inversia este aceeași cu inversiunea:

A^+ = A^{-1}

Dacă și sunt astfel încât produsul este definit și: $A$ $B$ $AB$

fie , $A^* A = I$
fie , $BB^* = I$
fie coloanele sunt liniar independente, iar rândurile sunt liniar independente, $A$ $B$

apoi

(AB)^+ = B^+ A^+

Pseudo-inversarea poate fi aplicată atât la scalari cât și la vectori. Aceasta implică faptul că ele sunt tratate ca matrici de dimensiunea corespunzătoare. Pseu-inversul unui scalar este zero dacă este zero, iar inversul în caz contrar: $X$ $X$ $X$

x^+ = \left\{\begin{matrice} 0, & x=0; \\ x^{-1} și x \ne 0. \end{matrice}\right.

Pseudo-inversul pentru vectorul zero este vectorul zero transpus. Pseudo-inversul pentru un vector diferit de zero este vectorul transpus conjugat împărțit la pătratul lungimii sale:

x^+ = \left\{\begin{matrix} 0^T, & x = 0; \\ {x^* \over x^* x}, & x \ne 0. \end{matrice}\right.

Pentru a dovedi, este suficient să verificăm că aceste mărimi satisfac definiția pseudoinverselor.

Origine

Dacă există, atunci din egalitate: $(A^* A)^{-1}$

ax = b,

ar trebui să

A^* A x = A^* b,

(A^* A)^{-1}(A^* A) x = (A^* A)^{-1}A^* b,

x = (A^* A)^{-1}A^* b,

care dă naştere conceptului de pseudo-inversare

A^+ = (A^* A)^{-1}A^*

Calcul

Fie rangul unei matrice de dimensiune . Atunci poate fi reprezentat ca , unde B este o matrice de dimensiune cu coloane liniar independente și este o matrice de dimensiune cu rânduri liniar independente. Apoi: $k$ $A$ $m\ori n$ $A$ $A=BC$ $m \time k$ $C$ $k \times n$

A^+ = C^*(CC^*)^{-1}(B^*B)^{-1}B^*

Dacă are un rang de linie completă, adică , atunci matricea de identitate poate fi aleasă și formula se reduce la . În mod similar, dacă are un rang de coloană completă, adică , atunci . $A$ $k = m$ $B$ $A^+ = A^*(AA^*)^{-1}$ $A$ $k = n$ $A^+ = (A^*A)^{-1}A^*$

Cel mai simplu mod de calcul de a obține o matrice pseudo-inversă este utilizarea unei descompunere a valorii singulare .

Dacă este o descompunere a valorii singulare , atunci . Pentru o matrice diagonală precum , pseudoinversul se obține din aceasta prin înlocuirea fiecărui element diferit de zero de pe diagonală cu inversul său. $A = U\Sigma V^*$ $A$ $A^+ = V\Sigma^+ U^*$ $\Sigma$

Există abordări optimizate pentru calcularea pseudoinversului pentru matricele bloc.

Uneori, volumul de calcule pentru găsirea unei matrice pseudo-inversă poate fi redus dacă se cunoaște pseudo-inversa pentru o matrice similară. În special, dacă o matrice similară diferă de cea inițială una câte una modificată, adăugată sau ștersă coloană sau rând, există algoritmi cumulativi care pot folosi relația dintre matrice.

Aplicație

Pseudo-inversia este strâns legată de metoda celor mai mici pătrate (LSM) pentru un sistem de ecuații liniare [3] .

În această metodă, problema rezolvării sistemului dat este înlocuită cu problema minimizării normei euclidiene la pătrat a discrepanței . În practică, LSM este folosit de obicei atunci când sistemul original este inconsecvent, dar mai jos vom lua în considerare cazul când acest sistem este compatibil. $A x = b$ $\|Ax - b\|^2$ $A x = b$

Soluția generală a unui sistem neomogen poate fi reprezentată ca suma unei soluții particulare a unui sistem neomogen și soluția generală a sistemului omogen corespunzător . $A x = b$ $A x = 0$

Lema: Dacă există, atunci soluția generală este întotdeauna reprezentabilă ca sumă a soluției pseudoinverse a sistemului neomogen și a soluției sistemului omogen: $(AA^*)^{-1}$ $X$

x=A^{*}(AA^{*})^{-1}b+(IA^{*}(AA^{*})^{-1}A)y.

Dovada:

$Topor$	$=$	$AA^(AA^)^{-1}$	$b$	$+$	$A y - AA^(AA^)^{-1} A y$
$Topor$	$=$		$b$	$+$	$A da - A y$
$Topor$	$=$		$b$	.

Aici vectorul este arbitrar (până la dimensiune). Ceilalți doi termeni au o matrice pseudo-inversă . Rescriind-o în forma , aducem expresia la forma: $y$ $A^*(AA^*)^{-1}$ $A^+$

x=A^{+}b+(IA^{+}A)y.

Primul termen este o soluție pseudo-inversă. În ceea ce privește metoda celor mai mici pătrate, este , care oferă norma euclidiană minimă pentru reziduu. Următorul termen oferă o soluție sistemului omogen , deoarece este operatorul de proiecție pe imaginea operatorului și, în consecință, este operatorul de proiecție pe nucleul operatorului . $X$ $A x = 0$ $A^{+}A=A^{*}(AA^{*})^{-1}A$ $A^{*}$ $(IA^{+}A)$ $A$

Literatură

↑ E. H. Moore: Despre reciproca matricei algebrice generale. Buletinul Societății Americane de Matematică 26, 394-395 (1920) 7.pdf
↑ Roger Penrose: O inversă generalizată pentru matrice. Proceedings of the Cambridge Philosophical Society 51, 406-413 (1955)
↑ Roger Penrose: Despre cea mai bună soluție aproximativă a ecuațiilor matriceale liniare. Proceedings of the Cambridge Philosophical Society 52, 17-19 (1956)
↑ Albert A.: Regresie, pseudo-inversie și estimare recursivă. transl. din engleza. Moscova, „Nauka”, 224 p. (1977)
↑ Beklemishev D.V.: Capitole suplimentare de algebră liniară. Moscova, Știință. (1983)