În teoria probabilităților și statistica matematică , distribuția Dirichlet (numită după Johann Peter Gustav Lejeune-Dirichlet ), adesea denumită Dir( α ), este o familie de distribuții de probabilitate multidimensionale continue ale numerelor reale nenegative parametrizate de vectorul α . Distribuția Dirichlet este o generalizare a distribuției Beta la cazul multivariat. Adică, funcția sa de densitate de probabilitate returnează probabilitatea de încredere ca probabilitatea fiecăruia dintre cele K evenimente care se exclud reciproc este egală , având în vedere că fiecare eveniment a fost observat o dată.
Funcția de densitate de probabilitate pentru o distribuție Dirichlet de ordin K este [1] :
unde , , , și este o funcție beta multidimensională , unde
Lasă și apoi [1]
Modul de distribuție este vectorul x ( x 1 , …, x K ) cu
Distribuția Dirichlet este conjugatul anterioară distribuției multinomiale și anume: dacă
unde β i este numărul de apariții ale lui i într-un eșantion de n puncte ale unei distribuții discrete pe {1, …, K } definită prin X , atunci
Această relație este utilizată în statistica bayesiană pentru estimarea parametrilor latenți, X , ai unei distribuții de probabilitate discrete având în vedere un set de n eșantioane. Evident, dacă priorul este notat cu Dir( α ), atunci Dir( α + β ) este distribuția posterioară după o serie de observații cu histograma β .
Dacă pentru
indiferent, atunciși
Deși X i nu sunt independenți unul de celălalt, ele pot fi generate dintr-un set de variabile aleatoare gamma independente . Din păcate, deoarece suma se pierde în procesul de formare a X = ( X 1 , …, X K ), devine imposibil să se restabilească valorile inițiale ale variabilelor aleatoare gamma numai din aceste valori. Totuși, datorită faptului că este mai ușor să lucrezi cu variabile aleatoare independente, această transformare a parametrilor poate fi utilă în demonstrarea proprietăților distribuției Dirichlet.
Metoda de construire a unui vector aleatoriu pentru o distribuție Dirichlet de dimensiune K cu parametri rezultă direct din această conexiune. În primul rând, obținem K eșantioane aleatoare independente din distribuțiile gamma , fiecare dintre acestea având o densitate
si apoi pune
Ca exemplu de utilizare a distribuției Dirichlet, putem propune o problemă în care este necesară tăierea firelor (fiecare cu o lungime inițială de 1,0) în K părți cu lungimi diferite, astfel încât toate părțile să aibă o lungime medie dată, dar cu posibilitatea unor variaţii în lungimile relative ale pieselor. Valorile α / α 0 determină lungimile medii ale pieselor de filet rezultate din distribuție. Dispersia în jurul mediei este invers proporțională cu α 0 .