Criteriul de bunătate al lui Kolmogorov

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 13 septembrie 2013; verificarea necesită 21 de modificări .

Testul de bunătate a potrivirii Kolmogorov este conceput pentru a testa ipoteza că eșantionul aparține unei legi de distribuție, adică pentru a verifica dacă distribuția empirică corespunde modelului așteptat .

Criteriul de omogenitate Smirnov  este utilizat pentru a testa ipoteza că două eșantioane independente aparțin aceleiași legi de distribuție, adică două distribuții empirice corespund aceleiași legi .

Aceste criterii sunt numite după matematicienii Andrei Nikolaevici Kolmogorov și Nikolai Vasilievici Smirnov .

Criteriul lui Smirnov pentru testarea ipotezei de omogenitate a două legi de distribuție empirice este unul dintre criteriile neparametrice cele mai frecvent utilizate .

Descriere

Dacă criteriile compară frecvențele a două distribuții separat pentru fiecare cifră, atunci aici frecvențele sunt comparate mai întâi pentru prima cifră, apoi pentru suma primei și a doua cifre, apoi pentru suma primei, a doua și a treia, etc. Astfel, de fiecare dată acumulat la acest interval de frecvență.

Dacă diferențele dintre cele două distribuții sunt semnificative, atunci la un moment dat diferența de frecvențe acumulate va atinge o valoare critică, iar diferențele pot fi considerate semnificative statistic.  Această diferență este inclusă în formula criteriului . Cu cât valoarea empirică este mai mare , cu atât diferențele sunt mai semnificative.

Statisticile testului Kolmogorov

Fie funcția de distribuție empirică (EDF) , construită pe eșantion , are forma:

unde indică dacă observația a căzut în zonă :

Se verifică dacă eșantionul este o variabilă aleatoare generată cu o funcție de distribuție . Statistica de test pentru funcția de distribuție empirică este definită după cum urmează:

unde by  este supremul funcției .

Distribuția statisticilor Kolmogorov

Să notăm ipoteza nulă ca fiind ipoteza că eșantionul respectă distribuția . Apoi, conform teoremei Kolmogorov, pentru statisticile introduse este adevărat:

Luăm în considerare faptul că criteriul are o regiune critică dreptaci .

Luarea unei decizii conform criteriului Kolmogorov.
Dacă statistica depășește punctul procentual al distribuției Kolmogorov a unui anumit nivel de semnificație , atunci ipoteza nulă (despre respectarea legii ) este respinsă. În caz contrar, ipoteza este acceptată la nivelul .

Dacă este suficient de aproape de 1, atunci poate fi aproximat cu formula:

Puterea asimptotică a testului este 1.

Să notăm acum ipoteza nulă ca fiind ipoteza că cele două eșantioane studiate respectă aceeași distribuție a variabilei aleatoare .

teorema lui Smirnov.
Fie funcții de distribuție empirice construite din eșantioane independente de volum și variabilă aleatoare . Atunci, dacă , atunci , unde .

Teorema lui Smirnov ne permite să construim un criteriu pentru testarea a două eșantioane pentru omogenitate.

Luarea unei decizii după criteriul Smirnov.
Dacă statistica depășește cuantila distribuției Kolmogorov pentru un anumit nivel de semnificație , atunci ipoteza nulă (despre omogenitatea probelor) este respinsă. În caz contrar, ipoteza este acceptată la nivelul .

Vezi și

Nota 1

În criteriul Kolmogorov, este de preferat să folosiți statistici cu corecția Bolșev în următoarea formă . Distribuția acestor statistici nu mai depinde atât de mult de dimensiunea eșantionului. Dependența distribuției sale de mărimea eșantionului poate fi neglijată la .

Nota 2

Testul clasic Kolmogorov este conceput pentru a testa ipoteze simple . Dacă ipoteza este testată cu privire la acordul eșantionului observat cu legea, ai cărui parametri sunt cunoscuți, atunci criteriul Kolmogorov nu are distribuție : nu contează cu ce lege este verificat acordul. Dacă ipoteza testată este adevărată, distribuția limită a statisticii Kolmogorov este distribuția Kolmogorov .

Totul se schimbă la testarea ipotezelor complexe , când eșantionul analizat evaluează parametrii legii teoretice, acordul cu care se verifică. Când se testează ipoteze complexe , libertatea de distribuție se pierde. La testarea ipotezelor complexe și a validității ipotezei testate, distribuțiile statisticilor testelor neparametrice de bunătate a potrivirii (și testul Kolmogorov) depind de o serie de factori: de tipul de lege observată corespunzător ipotezei testate; asupra tipului de parametru evaluat și a numărului de parametri evaluați; în unele cazuri, pe o anumită valoare a parametrului (de exemplu, în cazul familiilor de distribuții gamma și beta); din metoda de estimare a parametrilor. Diferențele în distribuțiile marginale ale acelorași statistici atunci când se testează ipoteze simple și complexe sunt atât de semnificative încât nu ar trebui în niciun caz neglijate.

Despre aplicarea criteriului Kolmogorov în testarea ipotezelor complexe

Link -uri