distributie . Distribuția Pearson | |
---|---|
Probabilitate densitate | |
funcția de distribuție | |
Desemnare | sau |
Opțiuni | este numărul de grade de libertate |
Purtător | |
Probabilitate densitate | |
funcția de distribuție | |
Valorea estimata | |
Median | despre |
Modă |
0 pentru dacă |
Dispersia | |
Coeficient de asimetrie | |
Coeficientul de kurtoză | |
Entropia diferenţială |
|
Funcția generatoare a momentelor | , dacă |
functie caracteristica |
Distribuție (chi-pătrat) cu grade de libertate - distribuția sumei pătratelor variabilelor aleatoare normale standard independente .
Fie variabile aleatoare normale standard independente împreună, adică: . Apoi variabila aleatoare
are o distribuție chi-pătrat cu grade de libertate, adică , sau, scris diferit:
.Distribuția chi-pătrat este un caz special al distribuției gamma , iar densitatea acesteia este:
,unde este distribuția gamma și este funcția gamma .
Funcția de distribuție are următoarea formă:
,unde și notează funcțiile gamma complete și , respectiv, incomplete .
are o distributie .
are o distribuție Fisher cu grade de libertate .
O altă generalizare a distribuției chi-pătrat este așa-numita distribuție chi-pătrat non-centrală care apare în unele probleme statistice.
O cuantilă este un număr (argument) pe care funcția de distribuție este egală cu o probabilitate dată, cerută. În linii mari, o cuantilă este rezultatul inversării unei funcții de distribuție, dar există subtilități cu funcțiile de distribuție discontinue.
Criteriul a fost propus de Karl Pearson în 1900 [1] . Lucrarea sa este privită ca fundamentul statisticii matematice moderne. Predecesorii lui Pearson au reprezentat pur și simplu rezultatele experimentale și au susținut că sunt corecte. În articolul său, Pearson a oferit câteva exemple interesante de utilizare greșită a statisticilor. De asemenea, a dovedit că unele dintre observațiile asupra roții ruletei (pe care a experimentat două săptămâni la Monte Carlo în 1892) erau atât de departe de frecvențele așteptate încât șansele de a le obține din nou, presupunând că roata ruletei este aranjată conștiincios, sunt egale cu unu.din 10 29 .
O discuție generală a criteriului și o bibliografie extinsă pot fi găsite în lucrarea de revizuire a lui William J. Cochran [2] .
Distribuția chi-pătrat are numeroase aplicații în inferența statistică, cum ar fi utilizarea testului chi-pătrat și estimarea variațiilor. Este utilizat în problema estimării mediei unei populații distribuite normal și în problema estimării pantei unei drepte de regresie datorită rolului său în distribuția t a lui Student . Este folosit în analiza varianței .
Următoarele sunt exemple de situații în care o distribuție chi-pătrat apare dintr-un eșantion normal:
Nume | Statistici |
---|---|
distribuția chi-pătrat | |
distribuție chi-pătrat non-centrală | |
distribuția chi | |
distribuția chi non-centrală |
Pentru orice număr p între 0 și 1, se definește o valoare p - probabilitatea de a obține pentru un model probabilistic dat de distribuție a valorilor unei variabile aleatoare aceeași valoare sau mai extremă a statisticilor (media aritmetică, mediană, etc.), comparativ cu cel observat, cu condiția ca ipoteza nulă să fie adevărată . În acest caz, este distribuția . Deoarece valoarea funcției de distribuție într-un punct pentru gradele de libertate corespunzătoare dă probabilitatea obținerii unei valori statistice mai puțin extreme decât acest punct, valoarea p poate fi obținută prin scăderea valorii funcției de distribuție din unitate. O valoare p mică – sub nivelul de semnificație selectat – înseamnă semnificație statistică . Acest lucru va fi suficient pentru a respinge ipoteza nulă. Pentru a distinge între rezultatele semnificative și nesemnificative, se folosește în mod obișnuit un nivel de 0,05.
Tabelul oferă valorile p pentru valorile corespunzătoare pentru primele zece grade de libertate.
Grade de libertate ( df ) | Valoare [3] | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
unu | 0,004 | 0,02 | 0,06 | 0,15 | 0,46 | 1.07 | 1,64 | 2,71 | 3,84 | 6,63 | 10.83 |
2 | 0,10 | 0,21 | 0,45 | 0,71 | 1.39 | 2.41 | 3.22 | 4,61 | 5,99 | 9.21 | 13.82 |
3 | 0,35 | 0,58 | 1.01 | 1.42 | 2.37 | 3,66 | 4,64 | 6.25 | 7,81 | 11.34 | 16.27 |
patru | 0,71 | 1.06 | 1,65 | 2.20 | 3.36 | 4,88 | 5,99 | 7,78 | 9.49 | 13.28 | 18.47 |
5 | 1.14 | 1,61 | 2.34 | 3.00 | 4.35 | 6.06 | 7.29 | 9.24 | 11.07 | 15.09 | 20.52 |
6 | 1,63 | 2.20 | 3.07 | 3,83 | 5.35 | 7.23 | 8,56 | 10.64 | 12.59 | 16.81 | 22.46 |
7 | 2.17 | 2,83 | 3,82 | 4,67 | 6.35 | 8.38 | 9,80 | 12.02 | 14.07 | 18.48 | 24.32 |
opt | 2,73 | 3.49 | 4,59 | 5.53 | 7.34 | 9.52 | 11.03 | 13.36 | 15.51 | 20.09 | 26.12 |
9 | 3.32 | 4.17 | 5.38 | 6.39 | 8.34 | 10.66 | 12.24 | 14.68 | 16.92 | 21.67 | 27.88 |
zece | 3,94 | 4,87 | 6.18 | 7.27 | 9.34 | 11.78 | 13.44 | 15.99 | 18.31 | 23.21 | 29.59 |
valoarea p | 0,95 | 0,90 | 0,80 | 0,70 | 0,50 | 0,30 | 0,20 | 0,10 | 0,05 | 0,01 | 0,001 |
Aceste valori pot fi calculate în termenii cuantilei (funcția de distribuție inversă) a distribuției chi-pătrat [4] . De exemplu, cuantila pentru p = 0,05 și df = 7 dă = 14,06714 ≈ 14,07 , ca în tabelul de mai sus. Aceasta înseamnă că pentru observarea experimentală a șapte variabile aleatoare independente , cu validitatea ipotezei nule „fiecare variabilă este descrisă printr-o distribuție standard normală cu o mediană de 0 și o abatere standard de 1”, valoarea poate fi obținută numai în 5% din implementări. Obținerea unei valori mai mari poate fi considerată de obicei un motiv suficient pentru a respinge această ipoteză nulă.
Tabelul dă rotunjire la sutimi; pentru tabele mai precise pentru mai multe grade de libertate vezi de exemplu aici [5] .
Distribuții de probabilitate | |
---|---|
Discret | |
Absolut continuu |