Probabilitatea bayesiană este o interpretare a conceptului de probabilitate folosit în teoria bayesiană. Probabilitatea este definită ca gradul de încredere în adevărul unei propoziții . Pentru a determina gradul de încredere în adevărul unei judecăți atunci când se primește informații noi, teoria bayesiană folosește teorema lui Bayes .
Teoria bayesiană și probabilitatea bayesiană sunt numite după Thomas Bayes (1702–1761), care a demonstrat un caz special al teoremei numită acum teorema lui Bayes . Termenul „bayesian” a intrat în uz în jurul anului 1950 , iar cea mai mare parte a ceea ce se numește acum „bayesian” nu este direct legat de Bayes. Laplace a dovedit un caz mai general al teoremei lui Bayes și l-a folosit pentru a rezolva probleme de mecanică cerească și statistică medicală. Laplace, însă, nu a considerat această teoremă importantă pentru dezvoltarea teoriei probabilităților. El a aderat la definiția clasică a probabilității .
Frank Ramsey , în The Foundations of Mathematics (1931), a fost primul care a prezentat ideea utilizării certitudinii subiective pentru a determina probabilitatea. Ramsey a propus această definiție ca o completare la definiția frecvenței , care era mai dezvoltată la acea vreme. Statisticianul Bruno de Finetti a aplicat ideile lui Ramsey în 1937 ca alternativă la determinarea frecvenței. Leonard Savage a extins această idee în The Foundations of Statistics (1954).
Au existat încercări de a defini formal conceptul intuitiv de „grad de certitudine”. Definiția cea mai generală se bazează pe un pariu : gradul de certitudine este reflectat de valoarea pariului pe care cineva este dispus să parieze că o propoziție este adevărată.
Variații în interpretarea bayesiană a probabilității: probabilitatea subiectivă și probabilitatea logică .
Probabilitatea bayesiană este în contrast cu probabilitatea de frecvență , în care probabilitatea este determinată de frecvența relativă de apariție a unui eveniment aleatoriu pe observații suficient de lungi.
Statistica matematică , bazată pe probabilitatea de frecvență , a fost dezvoltată de R. A. Fisher , E. Pearson și E. Neumann în prima jumătate a secolului al XX-lea. A. Kolmogorov a folosit și interpretarea frecvenței atunci când și-a descris axiomatica bazată pe integrala Lebesgue .
Diferența dintre interpretarea bayesiană și cea de frecvență joacă un rol important în statisticile practice. De exemplu, atunci când comparăm două ipoteze pe aceleași date, teoria testării ipotezelor statistice , bazată pe interpretarea frecvenței, vă permite să respingeți sau nu modelele de ipoteze. În același timp, un model adecvat poate fi respins din cauza faptului că un alt model pare mai adecvat pe aceste date. Metodele bayesiene, dimpotrivă, în funcție de datele de intrare, dau probabilitatea posterioară de a fi adecvate pentru fiecare dintre ipoteze.
Începând cu anii 1950, teoria bayesiană și probabilitatea bayesiană au fost aplicate pe scară largă prin, de exemplu, teorema lui Cox și principiul entropiei maxime . Pentru multi[ ce? ] , metodele bayesiene dau rezultate mai bune decât metodele bazate pe probabilitatea de frecvență .
Teoria bayesiană este folosită ca metodă de adaptare a probabilităților existente la datele experimentale nou obținute.
Teoria bayesiană este folosită pentru a construi filtre inteligente folosite, de exemplu, pentru a filtra e-mailurile spam .
Un detaliu neplăcut asociat cu utilizarea probabilității bayesiene este că nu este suficient să specificați probabilitatea pentru a înțelege natura acesteia. Luați în considerare următoarele situații:
Probabilitatea bayesiană de a „trage următoarea bilă neagră” în fiecare dintre aceste cazuri este de 0,5. Keynes a numit aceasta problema „gradului de certitudine”. Această problemă poate fi rezolvată prin introducerea probabilității unei probabilități (numită metaprobabilitate ).
1. Să presupunem că aveți o cutie de bile albe și negre și nu aveți informații despre câte bile de ce culoare sunt în ea. Fie - aceasta este o afirmație conform căreia probabilitatea de a extrage o bilă neagră în continuare este , atunci distribuția de probabilitate va fi o distribuție beta : Presupunând că extragerile de mingi sunt independente și echiprobabile, distribuția de probabilitate , după extragerea m bile negre și n bile albe, va fi de asemenea o distribuție Beta cu parametrii , . 2. Să presupunem că ați extras bile dintr-o cutie , jumătate dintre ele s-au dovedit a fi negre, iar restul - albe. În acest caz, distribuția de probabilitate va fi o distribuție beta . Așteptarea maximă a posteriori este . 3. Știi că exact jumătate dintre bile sunt negre, iar restul sunt albe. În acest caz, probabilitatea este 0,5 cu o probabilitate de 1: .