Probabilitate anterioară

În inferența statistică bayesiană , distribuția de probabilitate anterioară ( în engleză distribuția de probabilitate a priori , sau pur și simplu prior ) a unei valori incerte este o distribuție de probabilitate care exprimă ipoteze despre înainte de a lua în considerare datele experimentale. De exemplu, dacă este proporția alegătorilor care sunt gata să voteze pentru un anumit candidat, atunci distribuția prealabilă va fi ipoteza despre care se ține cont de rezultatele sondajelor sau ale alegerilor. În contrast cu probabilitatea posterioară . $p$ $p$ $p$ $p$

Conform teoremei lui Bayes , produsul normalizat al distribuției anterioare și al funcției de probabilitate este o distribuție condiționată a unei valori incerte în funcție de datele luate în considerare.

Distribuția anterioară este adesea dată subiectiv de un expert cu experiență. Când este posibil, se utilizează distribuția anterioară conjugată , ceea ce simplifică calculele.

Parametrii de distribuție anteriori sunt numiți hiperparametri pentru ai diferenția de parametrii modelului de date . De exemplu, dacă distribuția beta este utilizată pentru a modela distribuția unui parametru de distribuție Bernoulli , atunci: $p$

$p$ este un parametru al modelului de date (distribuția Bernoulli);
$\alfa$ și sunt parametrii distribuției anterioare (distribuția beta), adică hiper parametrii. $\beta$

Distribuire prealabilă informativă

Un antecedent informativ exprimă informații specifice despre o variabilă.

De exemplu, un antecedent adecvat pentru temperatura aerului de mâine la prânz ar fi o distribuție normală cu o medie egală cu temperatura de astăzi la prânz și o variație egală cu variația zilnică a temperaturii.

Astfel, distribuția posterioară pentru o problemă (temperatura de astăzi) devine anterioară pentru cealaltă problemă (temperatura de mâine); cu cât se acumulează mai multe dovezi într-un astfel de a priori, cu atât depinde mai puțin de ipoteza inițială și mai mult de datele acumulate.

Distribuție anterioară neinformativă

Un antecedent neinformativ exprimă informații neclare sau generale despre o variabilă.

Un astfel de nume nu este foarte exact, un a priori puțin informativ sau un obiectiv a priori ar fi mai precis , deoarece proprietățile distribuției nu sunt atribuite subiectiv.

De exemplu, un astfel de a priori poate exprima informații „obiective” conform cărora „variabila poate fi doar pozitivă” sau „variabila se află în interval”.

Cea mai simplă și mai veche regulă pentru atribuirea unui a priori neinformativ este principiul indiferenței , care atribuie probabilități egale tuturor posibilităților.

În problemele de estimare a parametrilor, utilizarea a priori non-informative dă de obicei rezultate care diferă puțin de cele tradiționale, deoarece funcția de probabilitate oferă adesea mai multe informații decât a priori neinformative.

S-au făcut încercări de a găsi a priori logic ( în engleză probabilitate a priori ) care să decurgă din însăși natura probabilității. Acesta este subiectul unei dezbateri filozofice care i-a împărțit pe adepții abordării bayesiene în două grupe: „obiectiv” (care consideră că un astfel de a priori există în multe situații aplicate) și „subiectiv” (care consideră că distribuțiile anterioare reprezintă de obicei opinii subiective). și nu poate fi riguros justificată (Williamson 2010)). Poate cel mai puternic argument pentru bayezismul obiectiv a fost făcut de Jaynes, Edwin Thompson .

Ca exemplu de a priori natural, urmând Jaynes (2003), luați în considerare situația în care mingea este cunoscută ca fiind ascunsă sub una dintre cele trei cupe A, B sau C, dar nu sunt disponibile alte informații. În acest caz, distribuția uniformă pare intuitiv a fi singura rezonabilă. Mai formal, problema nu se schimbă dacă numele cupelor sunt inversate. Prin urmare, merită să alegeți o astfel de distribuție anterioară, astfel încât permutarea numelor să nu o schimbe. Și distribuția uniformă este singura potrivită. $\textstyle p(A)=p(B)=p(C)={\frac {1}{3))$

Distribuție anterioară incorectă

Dacă teorema lui Bayes se scrie astfel:

P(A_{i}|B)={\frac {P(B|A_{i})P(A_{i})}{\sum _{j}P(B|A_{j}) P(A_{j})}}\,~,

atunci este evident că va rămâne adevărat dacă toate probabilitățile anterioare P ( A i ) și P ( A j ) sunt înmulțite cu aceeași constantă; același lucru este valabil și pentru variabile aleatoare continue . Probabilitățile posterioare vor rămâne normalizate la suma (sau integrala) lui 1, chiar dacă prioritățile nu au fost normalizate. Astfel, distribuția anterioară ar trebui să ofere doar proporțiile corecte de probabilități.

Probabilitate anterioară

Distribuire prealabilă informativă

Distribuție anterioară neinformativă

Distribuție anterioară incorectă

Vezi și