Suficiente statistici

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 6 decembrie 2021; verificarea necesită 1 editare .

O statistică suficientă pentru un parametru care definește o anumită familie de distribuții de probabilitate  este o statistică astfel încât probabilitatea condiționată a eșantionului pentru o valoare dată nu depinde de parametru. Adică, egalitatea este adevărată:

O statistică suficientă conține astfel toate informațiile despre parametrul care pot fi obținute din eșantionul X . Prin urmare, conceptul de statistică suficientă este utilizat pe scară largă în teoria estimării parametrilor .

Cea mai simplă statistică suficientă este eșantionul în sine , dar ceea ce este cu adevărat important sunt cazurile în care dimensiunea statisticii suficiente este mult mai mică decât dimensiunea eșantionului, în special atunci când statistica suficientă este exprimată doar prin câteva numere.

Se spune că o statistică suficientă este minim suficientă dacă pentru fiecare statistică suficientă T există o funcție măsurabilă non-aleatorie g , care este aproape peste tot .

Teorema de factorizare

Teorema de factorizare oferă o modalitate practică de a găsi suficiente statistici pentru o distribuție de probabilitate. Oferă condiții suficiente și necesare pentru suficiența statisticii, iar afirmarea teoremelor este uneori folosită ca definiție.

Fie  niște statistici și o funcție de densitate  condiționată sau o funcție de probabilitate (în funcție de tipul de distribuție) pentru vectorul de observație X . Atunci este o statistică suficientă pentru parametru dacă și numai dacă există astfel de funcții măsurabile și pe care le putem scrie:

Dovada

Mai jos este demonstrația pentru cazul special în care distribuția de probabilitate este discretă . Apoi  — Funcția de probabilitate .

Fie ca funcția dată să aibă o factorizare, ca în enunțul teoremei, și

Atunci noi avem:

Din aceasta vedem că probabilitatea condiționată a vectorului X pentru o valoare dată a statisticii nu depinde de parametru și, în consecință  , este o statistică suficientă.

Invers, putem scrie:

Din cele de mai sus, avem că primul factor din partea dreaptă nu depinde de parametru și poate fi luat ca o funcție din formularea teoremei. Celălalt factor este o funcție a și și poate fi luat ca o funcție .Astfel, se obține descompunerea necesară, care completează demonstrația teoremei.

Exemple

Distribuția Bernoulli

Fie  o succesiune de variabile aleatoare care sunt egale cu 1 cu probabilitate și egale cu 0 cu probabilitate (adică au o distribuție Bernoulli ). Apoi

dacă iei

Atunci această statistică este suficientă conform teoremei de factorizare, dacă notăm

Distribuția Poisson

Fie  o succesiune de variabile aleatoare cu distribuția Poisson . Apoi


Unde

Această statistică este suficientă conform teoremei de factorizare dacă notăm

Distribuție uniformă

Fie  o succesiune de variabile aleatoare distribuite uniform . Ad-hoc

Rezultă că statisticile sunt suficiente.

Distribuție normală

Pentru variabile aleatoare cu o distribuție normală , o statistică suficientă ar fi

Proprietăți

în plus, egalitatea se realizează numai atunci când este o funcție măsurabilă a lui T . ( Teorema Rao-Blackwell-Kolmogorov )

Vezi și

Literatură