Distribuția chi-pătrat

distributie . Distribuția Pearson
Probabilitate densitate
funcția de distribuție
Desemnare sau
Opțiuni este numărul de grade de libertate
Purtător
Probabilitate densitate
funcția de distribuție
Valorea estimata
Median despre
Modă 0 pentru dacă
Dispersia
Coeficient de asimetrie
Coeficientul de kurtoză
Entropia diferenţială

Funcția generatoare a momentelor , dacă
functie caracteristica

Distribuție (chi-pătrat) cu grade de libertate  - distribuția sumei pătratelor variabilelor aleatoare normale standard independente .

Definiție

Fie  variabile aleatoare normale standard independente împreună, adică: . Apoi variabila aleatoare

are o distribuție chi-pătrat cu grade de libertate, adică , sau, scris diferit:

.

Distribuția chi-pătrat este un caz special al distribuției gamma , iar densitatea acesteia este:

,

unde este distribuția gamma și  este funcția gamma .

Funcția de distribuție are următoarea formă:

,

unde și notează funcțiile gamma complete și , respectiv, incomplete .

Proprietăți ale distribuției chi-pătrat

, . prin distributie la .

Relația cu alte distribuții

are o distributie .

.

are o distribuție Fisher cu grade de libertate .

Variații și generalizări

O altă generalizare a distribuției chi-pătrat este așa-numita distribuție chi-pătrat non-centrală care apare în unele probleme statistice.

Quantiles

O cuantilă este un număr (argument) pe care funcția de distribuție este egală cu o probabilitate dată, cerută. În linii mari, o cuantilă este rezultatul inversării unei funcții de distribuție, dar există subtilități cu funcțiile de distribuție discontinue.

Istorie

Criteriul a fost propus de Karl Pearson în 1900 [1] . Lucrarea sa este privită ca fundamentul statisticii matematice moderne. Predecesorii lui Pearson au reprezentat pur și simplu rezultatele experimentale și au susținut că sunt corecte. În articolul său, Pearson a oferit câteva exemple interesante de utilizare greșită a statisticilor. De asemenea, a dovedit că unele dintre observațiile asupra roții ruletei (pe care a experimentat două săptămâni la Monte Carlo în 1892) erau atât de departe de frecvențele așteptate încât șansele de a le obține din nou, presupunând că roata ruletei este aranjată conștiincios, sunt egale cu unu.din 10 29 .

O discuție generală a criteriului și o bibliografie extinsă pot fi găsite în lucrarea de revizuire a lui William J. Cochran [2] .

Aplicații

Distribuția chi-pătrat are numeroase aplicații în inferența statistică, cum ar fi utilizarea testului chi-pătrat și estimarea variațiilor. Este utilizat în problema estimării mediei unei populații distribuite normal și în problema estimării pantei unei drepte de regresie datorită rolului său în distribuția t a lui Student . Este folosit în analiza varianței .

Următoarele sunt exemple de situații în care o distribuție chi-pătrat apare dintr-un eșantion normal:

Nume Statistici
distribuția chi-pătrat
distribuție chi-pătrat non-centrală
distribuția chi
distribuția chi non-centrală


Tabelul χ 2 și p - valorile

Pentru orice număr p între 0 și 1, se definește o valoare p - probabilitatea de a obține pentru un model probabilistic dat de distribuție a valorilor  unei variabile aleatoare aceeași valoare sau mai extremă a statisticilor (media aritmetică, mediană, etc.), comparativ cu cel observat, cu condiția ca ipoteza nulă să fie adevărată . În acest caz, este distribuția . Deoarece valoarea funcției de distribuție într-un punct pentru gradele de libertate corespunzătoare dă probabilitatea obținerii unei valori statistice mai puțin extreme decât acest punct, valoarea p poate fi obținută prin scăderea valorii funcției de distribuție din unitate. O valoare p mică – sub nivelul de semnificație selectat – înseamnă semnificație statistică . Acest lucru va fi suficient pentru a respinge ipoteza nulă. Pentru a distinge între rezultatele semnificative și nesemnificative, se folosește în mod obișnuit un nivel de 0,05.

Tabelul oferă valorile p pentru valorile corespunzătoare pentru primele zece grade de libertate.

Grade de libertate ( df ) Valoare [3]
unu 0,004 0,02 0,06 0,15 0,46 1.07 1,64 2,71 3,84 6,63 10.83
2 0,10 0,21 0,45 0,71 1.39 2.41 3.22 4,61 5,99 9.21 13.82
3 0,35 0,58 1.01 1.42 2.37 3,66 4,64 6.25 7,81 11.34 16.27
patru 0,71 1.06 1,65 2.20 3.36 4,88 5,99 7,78 9.49 13.28 18.47
5 1.14 1,61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1,63 2.20 3.07 3,83 5.35 7.23 8,56 10.64 12.59 16.81 22.46
7 2.17 2,83 3,82 4,67 6.35 8.38 9,80 12.02 14.07 18.48 24.32
opt 2,73 3.49 4,59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
zece 3,94 4,87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
valoarea p 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 0,001

Aceste valori pot fi calculate în termenii cuantilei (funcția de distribuție inversă) a distribuției chi-pătrat [4] . De exemplu, cuantila pentru p = 0,05 și df = 7 dă = 14,06714 ≈ 14,07 , ca în tabelul de mai sus. Aceasta înseamnă că pentru observarea experimentală a șapte variabile aleatoare independente , cu validitatea ipotezei nule „fiecare variabilă este descrisă printr-o distribuție standard normală cu o mediană de 0 și o abatere standard de 1”, valoarea poate fi obținută numai în 5% din implementări. Obținerea unei valori mai mari poate fi considerată de obicei un motiv suficient pentru a respinge această ipoteză nulă.

Tabelul dă rotunjire la sutimi; pentru tabele mai precise pentru mai multe grade de libertate vezi de exemplu aici [5] .

Vezi și

Note

  1. Pearson K. Pe criteriul că un sistem dat de abateri de la probabil în cazul unui sistem corelat de variabile este de așa natură încât se poate presupune în mod rezonabil că a apărut din eșantionarea aleatorie  //  Philosophical Magazine, Series 5 - Vol. 50 , nr. 302 . - P. 157-175 . - doi : 10.1080/14786440009463897 .
  2. Cochran WG The Test of Goodness of Fit  //  Analele matematice. stat. - 1952. - Vol. 23 , nr. 3 . - P. 315-345 .
  3. Testul Chi-Squared Arhivat 18 noiembrie 2013 la Wayback Machine Table B.2. Dr. Jacqueline S. McLaughlin la Universitatea de Stat din Pennsylvania. Această sursă citează la rândul său: RA Fisher și F. Yates , Statistical Tables for Biological Agricultural and Medical Research, ed. a 6-a, Tabelul IV. Au fost corectate două valori, 7,82 cu 7,81 și 4,60 cu 4,61.
  4. R Tutorial: Distribuția Chi-pătrat . Data accesului: 19 noiembrie 2019. Arhivat din original pe 16 februarie 2021.
  5. StatSoft: Tabele de distribuție - Distribuția chi-pătrat . Preluat la 29 ianuarie 2020. Arhivat din original la 26 ianuarie 2020.