Testul exact al lui Fisher este un test de semnificație statistică utilizat în analiza tabelelor încrucișate pentru eșantioane de dimensiuni mici. Se referă la teste de semnificație exactă , deoarece nu utilizează aproximări mari ale eșantionului (asimptotice când dimensiunea eșantionului tinde spre infinit).
Numită după inventatorul - Ronald Fisher , creația autorului a fost determinată de declarația lui Muriel Bristol ( ing. Muriel Bristol ), care a susținut că a reușit să detecteze în ce ordine au fost turnate ceaiul și laptele în ceașca ei.
Testul este utilizat în mod obișnuit pentru a examina semnificația relației dintre două variabile într-un tabel de dimensiuni factoriale ( tabel de contingență ). Valoarea probabilității de testare este calculată ca și cum valorile de la limitele tabelului sunt cunoscute. De exemplu, în cazul degustării de ceai, doamna Bristol știe numărul de căni cu fiecare preparat (lapte sau ceai mai întâi), așa că se presupune că furnizează numărul corect de ghiciri în fiecare categorie. După cum a subliniat Fisher, presupunând ipoteza nulă a independenței testului, aceasta duce la utilizarea unei distribuții hipergeometrice pentru un scor dat din tabel.
Cu mostre mari, testul chi-pătrat poate fi utilizat în această situație . Cu toate acestea, acest test nu este adecvat atunci când media valorilor din oricare dintre celulele tabelului cu limite date este sub 10: distribuția eșantionului calculată a statisticii testate este doar aproximativ egală cu distribuția chi-pătrat teoretică , iar aproximarea este inadecvată în aceste condiții (care apar atunci când dimensiunile eșantioanelor sunt mici sau datele sunt distribuite foarte inegal între celulele tabelului). Testul Fisher, după cum sugerează și numele, este precis și, prin urmare, poate fi utilizat indiferent de caracteristicile eșantionului. Testul devine dificil de calculat pentru probe mari sau tabele bine echilibrate, dar, din fericire, criteriul Pearson ( ) este bine aplicabil pentru aceste condiții.
Pentru calculele manuale, testul poate fi efectuat numai în cazul dimensiunii tabelelor factorilor . Cu toate acestea, principiul testului poate fi extins la cazul general al tabelelor , iar unele pachete statistice oferă astfel de calcule (uneori folosind o metodă Monte Carlo pentru a obține o aproximare).
Testele precise vă permit să obțineți analize mai precise pentru mostre mici sau date rare. Testele precise ale studiilor neparametrice sunt un instrument statistic adecvat pentru tratarea datelor dezechilibrate. Datele dezechilibrate analizate prin metode asimptotice tind să conducă la rezultate nesigure. Pentru seturi de date mari și bine echilibrate, estimările probabilității exacte și asimptotice sunt foarte asemănătoare. Dar pentru date mici, rare sau dezechilibrate, estimările exacte și asimptotice pot fi destul de diferite și chiar pot duce la concluzii opuse despre ipoteza în curs de dezvoltare [1] [2] [3] .
Necesitatea testului Fisher apare atunci când avem date împărțite în două categorii în două moduri separate. De exemplu, un eșantion de adolescenți poate fi împărțit în categorii pe de o parte în funcție de sex (băieți și fete), iar pe de altă parte, după o dietă sau nu. Se poate presupune că proporția persoanelor care urmează o dietă este mai mare în rândul fetelor decât în rândul băieților și dorim să constatăm dacă orice diferență observată în proporții este semnificativă statistic.
Datele ar putea arăta astfel:
Barbat tanar | fetelor | Total | |
ținând dietă | unu | 9 | zece |
nu la dieta | unsprezece | 3 | paisprezece |
Total | 12 | 12 | 24 |
Astfel de date nu sunt potrivite pentru analiza chi-pătrat, deoarece valorile așteptate din tabel sunt întotdeauna sub 10, iar numărul de grade de libertate din tabelul de dimensiuni factoriale este întotdeauna unul.
Întrebarea pe care o punem cu privire la aceste date este: având în vedere că 10 din 24 de adolescenți fac dietă și că 12 dintre cei 24 sunt fete, care este probabilitatea ca 10 persoane care fac dietă să fie atât de inegal repartizate între sexe? Dacă ar fi să alegem 10 adolescenți la întâmplare, care este probabilitatea ca 9 dintre ei să fi fost extrași dintr-un set de 12 femei și doar 1 dintr-un set de 12 băieți?
Înainte de a continua studiul testului Fisher, să introducem notația necesară. Să notăm numerele din celule cu literele , și , în consecință, numim totalurile însumării pe rânduri și coloane totale marginale (limită) și reprezentăm totalul cu litera .
Acum tabelul arată astfel:
Tineri | fetelor | Total | |
Tine dieta | |||
Nu la dietă | |||
Total |
Fisher a arătat că probabilitatea de a obține un astfel de set de mărimi este dată de distribuția hipergeometrică:
unde coloanele din paranteze sunt coeficienții binomi , iar simbolul " " este operatorul factorial .
Această formulă oferă probabilitatea exactă de a observa orice set specific de date având în vedere rezultatele marginale, totalul general și ipoteza nulă a aceleiași tendințe la dietă, indiferent de sex (raportul dintre cei care urmează și cei care nu fac dietă este același pentru băieți ca și pentru fete).
Fisher a arătat că ne putem ocupa doar de cazurile în care totalurile marginale sunt aceleași ca în tabelul de mai sus. În exemplul de mai sus, există astfel de cazuri 11. Dintre acestea, doar unul este la fel de „deformat” (în direcția unei tendințe feminine la dietă) ca și demonstrația:
Tineri | fetelor | Total | |
Tine dieta | 0 | zece | zece |
Nu la dietă | 12 | 2 | paisprezece |
Total | 12 | 12 | 24 |
Pentru a evalua semnificația statistică a datelor observate, adică probabilitatea globală a aceleiași sau mai pronunțate „înclinații” față de fetele aflate la dietă, presupunând ipoteza nulă , trebuie să calculăm probabilitățile de valoare pentru ambele tabele și adauga-le. Acest lucru dă așa-numitul test cu o singură coadă; pentru un test cu două fețe, trebuie să luăm în considerare și tabele care sunt în mod similar înclinate, dar în direcția opusă (adică să luăm în considerare cazul unei diete predominant masculine).
Cu toate acestea, clasificarea tabelelor în funcție de faptul că sunt „extrem de distorsionate” este problematică. Abordarea folosită de limbajul de programare R propune calcularea valorii criteriului prin însumarea probabilităților pentru toate tabelele cu probabilități mai mici sau egale cu probabilitățile tabelului observat. Pentru tabelele cu numere mici de celule, scorul testului cu două cozi poate fi semnificativ diferit de dublul scorului cu o singură coadă, spre deosebire de cazul statisticilor care au o distribuție de eșantionare simetrică.
Cele mai multe pachete statistice moderne calculează valoarea testelor Fisher, în unele cazuri chiar și în cazul în care o aproximare chi-pătrat ar fi, de asemenea, acceptabilă. Calculele efective efectuate de pachetele software statistice vor diferi în general de cele descrise. În special, pot apărea dificultăți numerice din factorii mari. Abordările computaționale simple, dar și mai eficiente se bazează pe utilizarea funcției gamma sau a funcției gamma logaritmice, dar calculul exact al probabilităților hipergeometrice și binomiale este un domeniu de cercetare curent.