O statistică suficientă pentru un parametru care definește o anumită familie de distribuții de probabilitate este o statistică astfel încât probabilitatea condiționată a eșantionului pentru o valoare dată nu depinde de parametru. Adică, egalitatea este adevărată:
O statistică suficientă conține astfel toate informațiile despre parametrul care pot fi obținute din eșantionul X . Prin urmare, conceptul de statistică suficientă este utilizat pe scară largă în teoria estimării parametrilor .
Cea mai simplă statistică suficientă este eșantionul în sine , dar ceea ce este cu adevărat important sunt cazurile în care dimensiunea statisticii suficiente este mult mai mică decât dimensiunea eșantionului, în special atunci când statistica suficientă este exprimată doar prin câteva numere.
Se spune că o statistică suficientă este minim suficientă dacă pentru fiecare statistică suficientă T există o funcție măsurabilă non-aleatorie g , care este aproape peste tot .
Teorema de factorizare oferă o modalitate practică de a găsi suficiente statistici pentru o distribuție de probabilitate. Oferă condiții suficiente și necesare pentru suficiența statisticii, iar afirmarea teoremelor este uneori folosită ca definiție.
Fie niște statistici și o funcție de densitate condiționată sau o funcție de probabilitate (în funcție de tipul de distribuție) pentru vectorul de observație X . Atunci este o statistică suficientă pentru parametru dacă și numai dacă există astfel de funcții măsurabile și pe care le putem scrie:
Mai jos este demonstrația pentru cazul special în care distribuția de probabilitate este discretă . Apoi — Funcția de probabilitate .
Fie ca funcția dată să aibă o factorizare, ca în enunțul teoremei, și
Atunci noi avem:
Din aceasta vedem că probabilitatea condiționată a vectorului X pentru o valoare dată a statisticii nu depinde de parametru și, în consecință , este o statistică suficientă.
Invers, putem scrie:
Din cele de mai sus, avem că primul factor din partea dreaptă nu depinde de parametru și poate fi luat ca o funcție din formularea teoremei. Celălalt factor este o funcție a și și poate fi luat ca o funcție .Astfel, se obține descompunerea necesară, care completează demonstrația teoremei.
Fie o succesiune de variabile aleatoare care sunt egale cu 1 cu probabilitate și egale cu 0 cu probabilitate (adică au o distribuție Bernoulli ). Apoi
dacă iei
Atunci această statistică este suficientă conform teoremei de factorizare, dacă notăm
Fie o succesiune de variabile aleatoare cu distribuția Poisson . Apoi
Unde
Această statistică este suficientă conform teoremei de factorizare dacă notăm
Fie o succesiune de variabile aleatoare distribuite uniform . Ad-hoc
Rezultă că statisticile sunt suficiente.
Pentru variabile aleatoare cu o distribuție normală , o statistică suficientă ar fi
Dicționare și enciclopedii |
---|