Testul de bunătate a potrivirii Kolmogorov este conceput pentru a testa ipoteza că eșantionul aparține unei legi de distribuție, adică pentru a verifica dacă distribuția empirică corespunde modelului așteptat .
Criteriul de omogenitate Smirnov este utilizat pentru a testa ipoteza că două eșantioane independente aparțin aceleiași legi de distribuție, adică două distribuții empirice corespund aceleiași legi .
Aceste criterii sunt numite după matematicienii Andrei Nikolaevici Kolmogorov și Nikolai Vasilievici Smirnov .
Criteriul lui Smirnov pentru testarea ipotezei de omogenitate a două legi de distribuție empirice este unul dintre criteriile neparametrice cele mai frecvent utilizate .
Dacă criteriile compară frecvențele a două distribuții separat pentru fiecare cifră, atunci aici frecvențele sunt comparate mai întâi pentru prima cifră, apoi pentru suma primei și a doua cifre, apoi pentru suma primei, a doua și a treia, etc. Astfel, de fiecare dată acumulat la acest interval de frecvență.
Dacă diferențele dintre cele două distribuții sunt semnificative, atunci la un moment dat diferența de frecvențe acumulate va atinge o valoare critică, iar diferențele pot fi considerate semnificative statistic. Această diferență este inclusă în formula criteriului . Cu cât valoarea empirică este mai mare , cu atât diferențele sunt mai semnificative.
Fie funcția de distribuție empirică (EDF) , construită pe eșantion , are forma:
unde indică dacă observația a căzut în zonă :
Se verifică dacă eșantionul este o variabilă aleatoare generată cu o funcție de distribuție . Statistica de test pentru funcția de distribuție empirică este definită după cum urmează:
unde by este supremul funcției .
Să notăm ipoteza nulă ca fiind ipoteza că eșantionul respectă distribuția . Apoi, conform teoremei Kolmogorov, pentru statisticile introduse este adevărat:
Luăm în considerare faptul că criteriul are o regiune critică dreptaci .
Luarea unei decizii conform criteriului Kolmogorov. Dacă statistica depășește punctul procentual al distribuției Kolmogorov a unui anumit nivel de semnificație , atunci ipoteza nulă (despre respectarea legii ) este respinsă. În caz contrar, ipoteza este acceptată la nivelul . |
Dacă este suficient de aproape de 1, atunci poate fi aproximat cu formula:
Puterea asimptotică a testului este 1.
Să notăm acum ipoteza nulă ca fiind ipoteza că cele două eșantioane studiate respectă aceeași distribuție a variabilei aleatoare .
teorema lui Smirnov. Fie funcții de distribuție empirice construite din eșantioane independente de volum și variabilă aleatoare . Atunci, dacă , atunci , unde . |
Teorema lui Smirnov ne permite să construim un criteriu pentru testarea a două eșantioane pentru omogenitate.
Luarea unei decizii după criteriul Smirnov. Dacă statistica depășește cuantila distribuției Kolmogorov pentru un anumit nivel de semnificație , atunci ipoteza nulă (despre omogenitatea probelor) este respinsă. În caz contrar, ipoteza este acceptată la nivelul . |
În criteriul Kolmogorov, este de preferat să folosiți statistici cu corecția Bolșev în următoarea formă . Distribuția acestor statistici nu mai depinde atât de mult de dimensiunea eșantionului. Dependența distribuției sale de mărimea eșantionului poate fi neglijată la .
Testul clasic Kolmogorov este conceput pentru a testa ipoteze simple . Dacă ipoteza este testată cu privire la acordul eșantionului observat cu legea, ai cărui parametri sunt cunoscuți, atunci criteriul Kolmogorov nu are distribuție : nu contează cu ce lege este verificat acordul. Dacă ipoteza testată este adevărată, distribuția limită a statisticii Kolmogorov este distribuția Kolmogorov .
Totul se schimbă la testarea ipotezelor complexe , când eșantionul analizat evaluează parametrii legii teoretice, acordul cu care se verifică. Când se testează ipoteze complexe , libertatea de distribuție se pierde. La testarea ipotezelor complexe și a validității ipotezei testate, distribuțiile statisticilor testelor neparametrice de bunătate a potrivirii (și testul Kolmogorov) depind de o serie de factori: de tipul de lege observată corespunzător ipotezei testate; asupra tipului de parametru evaluat și a numărului de parametri evaluați; în unele cazuri, pe o anumită valoare a parametrului (de exemplu, în cazul familiilor de distribuții gamma și beta); din metoda de estimare a parametrilor. Diferențele în distribuțiile marginale ale acelorași statistici atunci când se testează ipoteze simple și complexe sunt atât de semnificative încât nu ar trebui în niciun caz neglijate.