Analiza variatiei

Analiza varianței  este o metodă în statistica matematică care vizează găsirea dependențelor în datele experimentale prin examinarea semnificației diferențelor în valorile medii [1] [2] . Spre deosebire de testul t , vă permite să comparați mediile a trei sau mai multe grupuri. Dezvoltat de R. Fisher pentru a analiza rezultatele studiilor experimentale. Denumirea ANOVA (din engleză.  ANalysis Of VAriance ) [3] se găsește și în literatură .

Tipuri de ANOVA

Esența analizei varianței este de a studia influența uneia sau mai multor variabile independente , denumite de obicei factori, asupra variabilei dependente . Variabilele dependente sunt reprezentate de valorile scalelor absolute (scala raportului). Variabilele independente sunt nominative (scara de nume), adică reflectă apartenența la grup și pot avea două sau mai multe valori (tip, gradație sau nivel). Exemple de variabilă independentă cu două valori ar fi sexul (feminin: , bărbat: ) sau tipul de grup de tratament (control: , experimental: ). Gradările corespunzătoare eșantioanelor independente de obiecte se numesc intergrup, iar gradațiile corespunzătoare eșantioanelor dependente se numesc intragrup.

În funcție de tipul și numărul de variabile, există:

Model matematic de analiză a varianței

Modelul matematic de analiză a dispersiei este un caz special al modelului liniar de bază . Lăsați metodele să fie folosite pentru a măsura mai mulți parametri ale căror valori exacte sunt . În acest caz, rezultatele măsurătorilor diferitelor cantități prin diferite metode pot fi reprezentate ca:

,

Unde:

Apoi varianțele următoarelor variabile aleatoare: (unde:




)

sunt exprimate ca:

și să satisfacă identitatea:

Procedura de analiză a varianței constă în determinarea raportului dintre variația sistematică (între grupuri) și variația aleatorie (în cadrul grupului) în datele măsurate. Ca indicator al variabilității, se utilizează suma pătratelor abaterii valorilor parametrilor de la medie: (din engleză. Sum of Squares ). Se poate demonstra că suma totală a pătratelor se descompune într-o sumă intergrup de pătrate și o sumă intragrup de pătrate :

Fie valoarea exactă a fiecărui parametru să fie așteptarea sa matematică egală cu media populației . În absenţa erorilor sistematice, media grupului şi media populaţiei sunt identice: . Atunci eroarea de măsurare aleatorie este diferența dintre rezultatul măsurării și media grupului: . Dacă metoda are un efect sistematic, atunci eroarea sistematică sub influența acestui factor este diferența dintre media grupului și media populației: .

Atunci ecuația poate fi reprezentată după cum urmează:

, sau

.

Apoi

Unde

prin urmare

Gradele de libertate sunt descompuse într-un mod similar:

Unde

și este dimensiunea eșantionului complet și  este numărul de grupuri.

Apoi, varianța fiecărei părți, denumită în modelul de analiză a varianței „pătrat mediu”, sau (din engleză Mean Square ), este raportul dintre suma pătratelor și numărul gradelor lor de libertate:

Raportul dintre variațiile intergrup și intragrup are o distribuție F ( distribuția Fischer ) și este determinat folosind ( criteriul F Fisher ):

Principii și aplicații

Punctele de plecare ale analizei varianței sunt

Ipoteza nulă în analiza varianței este afirmația despre egalitatea valorilor medii:

Când ipoteza nulă este respinsă, se acceptă ipoteza alternativă că nu toate mediile sunt egale, adică există cel puțin două grupuri care diferă ca medie:

Dacă există trei sau mai multe grupuri, se folosesc teste t post-hoc sau metoda contrastelor pentru a determina diferențele dintre medii .

Analiza unidirecțională a varianței

Cel mai simplu caz de analiză a varianței este o analiză unidimensională unidirecțională pentru două sau mai multe grupuri independente, când toate grupurile sunt combinate conform unui singur atribut. Pe parcursul analizei se testează ipoteza nulă despre egalitatea mijloacelor. Când se analizează două grupuri, analiza varianței este identică cu testul t Student cu două eșantioane pentru eșantioane independente, iar valoarea statisticii F este egală cu pătratul statisticii t corespunzătoare .

Pentru a confirma afirmația despre egalitatea dispersiilor, se folosește de obicei testul Levene . Dacă ipoteza egalității varianțelor este respinsă, analiza principală nu este aplicabilă. Dacă variațiile sunt egale, atunci criteriul F al lui Fisher este utilizat pentru a evalua raportul dintre variabilitatea intergrup și intragrup :

Dacă statistica F depășește valoarea critică, atunci ipoteza nulă nu poate fi acceptată (respinsă) și se face o concluzie despre inegalitatea mediilor. Când se analizează mediile celor două grupuri, rezultatele pot fi interpretate imediat după aplicarea testului Fisher .

Dacă există trei sau mai multe grupuri, este necesară compararea în perechi a mediilor pentru a identifica diferențele semnificative statistic între ele. Analiza a priori include metoda contrastelor, în care suma de pătrate intergrup este împărțită în sumele de pătrate ale contrastelor individuale:

unde există un contrast între mediile celor două grupuri și apoi folosind testul Fisher , se verifică raportul dintre pătratul mediu pentru fiecare contrast și pătratul mediu din cadrul grupului:

Analiza a posteriori include teste post-hoc t folosind metodele Bonferroni sau Scheffe, precum și o comparație a diferențelor medii folosind metoda Tukey. O caracteristică a testelor post-hoc este utilizarea unui pătrat mediu intragrup pentru a evalua orice pereche de medii. Testele Bonferroni și Scheffe sunt cele mai conservatoare, deoarece folosesc cea mai mică regiune critică la un anumit nivel de semnificație .

Pe lângă estimarea mediilor, analiza varianței include determinarea coeficientului de determinare , arătând ce proporție din variabilitatea totală explică acest factor:

Analiza multivariată a varianței

, Unde:

Spre deosebire de modelul univariat, unde există o sumă intergrup de pătrate, modelul de analiză multivariată include sumele pătratelor pentru fiecare factor separat și sumele pătratelor tuturor interacțiunilor dintre ele. Astfel, în modelul cu doi factori, suma pătratelor intergrupurilor este descompusă în suma pătratelor factorului , suma pătratelor factorului și suma pătratelor interacțiunii factorilor și :

În consecință, modelul cu trei factori include suma pătratelor factorului , suma pătratelor factorului , suma pătratelor factorului și suma pătratelor interacțiunilor factorilor și , și , și , precum și interacțiunile tuturor celor trei factori :

Gradele de libertate sunt extinse într-un mod similar:

Unde

și este volumul eșantionului complet,  este numărul de niveluri (grupuri) ale factorului și  este numărul de niveluri (grupuri) ale factorului .

Analiza testează mai multe ipoteze nule :

Fiecare ipoteză este testată folosind criteriul Fisher:

La respingerea ipotezei nule despre influența unui singur factor, se acceptă afirmația că există un efect principal al factorului ( etc.). Când se respinge ipoteza nulă despre interacțiunea factorilor, se acceptă afirmația că influența factorului se manifestă diferit la diferite niveluri ale factorului . De obicei, în acest caz, rezultatele analizei generale sunt recunoscute ca nevalide, iar influența factorului este verificată separat la fiecare nivel al factorului folosind o analiză unidirecțională a varianței sau t - test .

Note

  1. Analiza varianței . Preluat la 15 martie 2011. Arhivat din original la 23 mai 2012.
  2. Analiza dispersiei - articol din Marea Enciclopedie Sovietică . Bolşev, L. N.. 
  3. A. D. Nasledov. Metode matematice de cercetare psihologică. Sankt Petersburg, 2008. ISBN 5-9268-0275-X

Literatură