Distribuție hipergeometrică

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 28 martie 2018; verificările necesită 2 modificări .
Distribuție hipergeometrică
Funcția de probabilitate
Desemnare
Opțiuni

Purtător
Funcția de probabilitate
Valorea estimata
Modă
Dispersia
Coeficient de asimetrie
Coeficientul de kurtoză
Funcția generatoare a momentelor
functie caracteristica

Distribuția hipergeometrică în teoria probabilității modelează numărul de eșantioane bune fără a reveni dintr-o populație finită.

Exemplu

alungit nu întins Total
cu un defect k D - k D
nici un defect n−k N + k - n - D N-D
Total n N − n N

Un exemplu tipic este prezentat în tabelul de mai sus: a fost efectuată o livrare de N articole, dintre care D sunt defecte. Distribuția hipergeometrică descrie probabilitatea ca într-un eșantion de n articole diferite extrase dintr-un transport, exact k articole să fie defecte.

În general, dacă o variabilă aleatoare X urmează o distribuție hipergeometrică cu parametrii N , D și n , atunci probabilitatea de a obține exact k succese este dată de:

Această probabilitate este pozitivă atunci când k se află între max{ 0, D + n − N } și min{ n , D }.

Formula de mai sus poate fi interpretată astfel: există selecții posibile (fără înlocuire). Există modalități de a selecta k obiecte defecte și modalități de a umple restul eșantionului cu obiecte fără defecte.

În cazul în care dimensiunea populației este mare în comparație cu dimensiunea eșantionului (adică, N este mult mai mare decât n ), distribuția hipergeometrică este bine aproximată printr-o distribuție binomială cu parametrii n (număr de încercări) și p = D / N ( probabilitatea de succes într-un singur test).

Definiție

Să existe o colecție finită constând din elemente. Să presupunem că (defecte) dintre ele au proprietatea de care avem nevoie. Restul nu au această proprietate. Un grup de elemente este selectat aleatoriu din populația totală . Fie o variabilă aleatorie egală cu numărul de elemente selectate care au proprietatea dorită. Atunci funcția de probabilitate are forma:

,

unde denotă coeficientul binom . Scriem: .

Momente

, .

Exemplu de aplicație

O aplicație clasică a distribuției hipergeometrice este eșantionarea fără înlocuire. Luați în considerare o urnă cu două tipuri de bile: alb și negru. Să definim desenul unei mingi albe ca un succes și una neagră ca un eșec. Dacă N este numărul tuturor bilelor din urnă și D este numărul de bile albe, atunci N  -  D este numărul de bile negre.
Acum să presupunem că într-o urnă există 5 bile albe și 45 de bile negre. Stând lângă urnă, închideți ochii și desenați 10 bile ( n ). Care este probabilitatea p (k=4) de a extrage 4 bile albe (și deci 6 bile negre)?

Sarcina este descrisă de următorul tabel:

alungit nu întins Total
bile albe 4 ( k ) 1 = 5 − 4 ( D − k ) 5 (D)
bile negre 6 = 10 - 4 ( n - k ) 39 = 50 + 4 − 10 − 5 ( N + k − n − D ) 45 ( N−D )
Total 10 ( n ) 40 ( n−n ) 50 ( N )

Probabilitatea Pr ( k = x ) ca exact x bile albe să fie extrase (= numărul de reușite) poate fi calculată folosind formula:

De aici, în exemplul nostru ( x = 4), obținem:

Astfel, probabilitatea de a extrage exact 4 bile albe este destul de mică (aproximativ 0,004). Aceasta înseamnă că atunci când efectuăm experimentul (scoaterea a 10 bile din urnă cu 50 de bile fără înlocuire) de 1000 de ori, ne așteptăm să obținem rezultatul de mai sus de 4 ori.

În ceea ce privește probabilitatea de a extrage toate cele 5 bile albe, este intuitiv clar că va fi mai mică decât probabilitatea de a extrage 4 bile albe. Să calculăm această probabilitate.

alungit nu întins Total
bile albe 5 ( k ) 0 = 5 − 5 ( D − k ) 5 (D)
bile negre 5 = 10 - 5 ( n - k ) 40 = 50 + 5 - 10 - 5 ( N + k - n - D ) 45 ( N−D )
Total 10 ( n ) 40 ( n−n ) 50 ( N )

Astfel, obținem probabilitatea:

După cum era de așteptat, probabilitatea de a extrage 5 bile albe este mai mică decât probabilitatea de a extrage 4 bile albe.

Concluzie:
Întrebarea inițială poate fi extinsă după cum urmează: Dacă dintr-o urnă se extrag 10 bile (conținând 5 bile albe și 45 negre), care este probabilitatea de a extrage cel puțin 4 bile albe? Pentru a răspunde la această întrebare, este necesar să se calculeze funcția de distribuție p(k>=4). Deoarece distribuția hipergeometrică este o distribuție de probabilitate discretă, funcția de distribuție poate fi ușor calculată ca sumă a probabilităților corespunzătoare.

În exemplul nostru, este suficient să adăugați Pr ( k = 4) și Pr ( k = 5):

Pr ( k ≥ 4) = 0,003964583 + 0,0001189375 = 0,004083520

Simetrie

Această simetrie este intuitivă dacă recolorați bilele albe în negru și invers, astfel încât bilele albe și negre pur și simplu schimbă rolurile.

Această simetrie este intuitivă dacă, în loc să desenezi bile, marchezi bilele pe care le-ai desena. Ambele expresii dau probabilitatea ca exact k bile să fie negre și marcate desenate.

Relația cu alte distribuții