În algebra liniară, se spune că o matrice pătrată A este diagonalizabilă dacă este similară cu o matrice diagonală , adică dacă există o matrice nesingulară P astfel încât P −1 AP este o matrice diagonală. Dacă V este un spațiu vectorial cu dimensiuni finite , atunci o mapare liniară T : V → V se spune că este diagonalizabilă dacă există o bază ordonată în V astfel încât T să fie reprezentat ca o matrice diagonală. Diagonalizarea este procesul de găsire a matricei diagonale corespunzătoare pentru o matrice diagonalizabilă sau o mapare liniară. [1] O matrice pătrată care nu poate fi diagonalizată se numește defectuoasă .
Matricele și mapările diagonalizabile sunt interesante deoarece matricele diagonale sunt ușor de lucrat: valorile proprii și vectorii sunt cunoscute, exponențiarea se face prin ridicarea elementelor diagonale la o putere, iar determinantul este produsul elementelor diagonale. Din punct de vedere geometric, o matrice diagonalizabilă este o scalare neuniformă: în fiecare direcție, întinderea are loc în cazul general cu un coeficient diferit în funcție de numărul de pe diagonală.
Faptul fundamental despre mapările și matricele diagonalizabile este exprimat în următoarele afirmații.
O matrice sau o mapare liniară este diagonalizabilă pe un câmp F dacă și numai dacă polinomul minim este un produs al factorilor liniari peste câmpul F. Cu alte cuvinte, o matrice este diagonalabilă dacă și numai dacă toți divizorii polinomului minim sunt liniari.
Următoarea condiție (suficientă, dar nu necesară) este adesea utilă.
Fie A o matrice peste F . Dacă A este diagonalizabilă, atunci orice putere a lui A este diagonalizabilă. Dacă A este inversabil, F este închis algebric, A n este diagonalizabil pentru un n care nu este un multiplu al caracteristicii F , atunci A este diagonalizabil.
Peste C , aproape orice matrice este diagonalabilă. Mai precis, mulțimea de n × n matrice complexe care nu sunt diagonalizabile peste C , atunci când este considerată ca o n × n submulțime a lui C , are măsura Lebesgue zero . Se mai poate spune că matricele diagonalizabile formează o submulțime densă în cadrul topologiei Zariski : complementul acestei submulțimi constă în mulțimea în care discriminantul polinomului caracteristic dispare, adică pe hipersuprafață. Acesta nu este cazul pentru R.
Descompunerea Jordan-Chevalley reprezintă operatorul ca sumă a părților diagonalizabile și nilpotente . Prin urmare, o matrice este diagonalizabilă dacă și numai dacă partea nilpotentă este zero. Cu alte cuvinte, o matrice este diagonalabilă dacă fiecare bloc al formei Jordan nu are o parte nilpotentă.
Dacă matricea A poate fi diagonalizată, adică
apoi
Scriem P ca o matrice bloc cu vectori coloană
atunci ecuația de mai sus poate fi rescrisă ca
Vectorii coloană ai lui P sunt vectorii proprii drepti ai lui A , elementele diagonale corespunzătoare sunt valorile proprii. Invertibilitatea lui P implică, de asemenea, că vectorii proprii sunt independenți liniar și formează o bază în F n . Aceasta este o condiție necesară și suficientă pentru diagonalizare. Vectorii rând P −1 sunt vectorii proprii stângi ai lui A .
Dacă A este o matrice hermitiană , atunci se pot alege vectorii proprii ai lui A astfel încât să formeze o bază ortogonală în C n . În aceste condiții, P va fi o matrice unitară , iar P −1 este egal cu conjugatul hermitian al lui P .
În practică, diagonalizarea matricelor se realizează pe un computer. Există o serie de algoritmi care permit realizarea acestui proces.
Se spune că o mulțime de matrice este diagonalizabilă în comun dacă există o matrice inversabilă unică P astfel încât P −1 AP este o matrice diagonală pentru fiecare A din mulțime. Următoarea teoremă caracterizează matricele diagonalizabile în comun: un set de matrice este un set de matrici de comutație diagonalizabile dacă și numai dacă este diagonalizabil în comun. [2]
Mulțimea tuturor n × n matrice diagonalizabile peste C pentru n > 1 nu este diagonalizabilă în comun. De exemplu, matrice
sunt diagonalizabile, dar nu în comun, deoarece nu fac naveta.
O mulțime constă în comutarea matricelor normale dacă și numai dacă este diagonalizată împreună de o matrice unitară, adică există o matrice unitară U astfel încât U*AU este diagonală pentru orice matrice A din mulțime.
În general, matricea de rotație nu este diagonalizabilă peste numerele reale, dar toate matricele de rotație sunt diagonalizabile peste câmpul numerelor complexe. Chiar dacă matricea este nediagonalizabilă, este posibil să o reduceți la „cea mai bună formă posibilă” și să creați o matrice cu aceleași proprietăți, care să conțină valori proprii pe diagonala principală și uni sau zerouri pe diagonala de mai sus, adică Iordan forma normală .
Unele matrice nu sunt diagonalizabile peste niciun câmp, printre ele pot fi specificate matrice nilpotente non-zero . Acest lucru se întâmplă dacă multiplicitatea algebrică și geometrică a valorii proprii nu se potrivesc. Considera
Această matrice nu poate fi diagonalizată: nu există o matrice U pentru care U −1 CU să fie o matrice diagonală. C are o valoare proprie (zero) a multiplicității algebrice 2 și a multiplicității geometrice 1.
Unele matrici reale nu pot fi diagonalizate peste numere reale. Luați în considerare matricea
Matricea B nu are valori proprii reale, deci nu există o matrice reală Q pentru care Q −1 BQ este diagonală. Dar peste câmpul numerelor complexe, putem diagonaliza B . Dacă luăm în considerare
atunci Q −1 BQ este diagonală.
Rețineți că exemplele de mai sus arată că suma matricelor diagonalizabile nu este întotdeauna diagonalizabilă.
Luați în considerare matricea
Această matrice are valori proprii
A este o matrice 3x3 cu 3 valori proprii distincte; deci este diagonalizabil. Rețineți că dacă o matrice n × n are exact n valori proprii distincte, atunci este diagonalizabilă.
Valorile proprii vor apărea în forma diagonalizată A , astfel încât la găsirea valorilor proprii, matricea A este diagonalizată. Vectorii proprii pot fi utilizați pentru a diagonaliza A.
Vectorii proprii ai lui A sunt
Se poate verifica ca
Fie P o matrice în care vectorii proprii dați sunt coloanele.
Rețineți că nu există o ordine distinctă pentru coloanele lui P ; schimbarea ordinii vectorilor proprii în P va schimba doar ordinea valorilor proprii în forma diagonală A. [3]
Matricea P diagonalizează A , ceea ce este ușor de văzut:
Aceasta rezultă din faptul că pentru orice bază standard ,
unde am profitat de ceea ce este coloana k-a a , deci . Rețineți că valorile proprii au apărut în matricea diagonală.
Diagonalizarea poate fi utilizată pentru a calcula eficient puterile unei matrice A dacă matricea este diagonalizabilă. Să luăm asta
unde este o matrice diagonală. Apoi prin asociativitatea produsului matricelor
Ultimul produs este ușor de calculat deoarece conține puterile matricei diagonale. Această abordare poate fi generalizată la exponentul matricei și la alte funcții ale matricei , deoarece acestea pot fi reprezentate ca serii de puteri.
Luați în considerare următoarea matrice:
Calcularea diferitelor puteri ale lui M duce la un model interesant:
Acest fenomen poate fi explicat folosind diagonalizarea lui M . Avem nevoie de o bază R 2 constând din vectori proprii M . Una dintre baze este
unde e i denotă baza standard a lui R n . Schimbarea inversă a bazei este dată de expresii
Calculele arată că
Prin urmare , a și b sunt valori proprii corespunzătoare u și v . Prin liniaritatea produsului matricei se obține
Revenind la baza standard, obținem asta
Forma matriceală a relațiilor descrise mai sus are forma
ceea ce explică tiparul menționat mai sus.
În mecanica cuantică și chimia cuantică , diagonalizarea matricei este una dintre cele mai utilizate proceduri în calcule. Motivul principal este că ecuația Schrödinger independentă de timp este o ecuație cu valori proprii și, în aproape toate aplicațiile fizice, în spațiul infinit-dimensional ( Hilbert ). În abordări aproximative, spațiul Hilbert este înlocuit cu un spațiu finit-dimensional, după care ecuația Schrödinger poate fi reformulată ca o problemă de găsire a valorilor proprii ale unei matrice simetrice reale (sau complexe Hermitian). Această abordare se bazează pe principiul variațional .