În statistica matematică și teoria deciziei, o estimare de decizie bayesiană este o estimare statistică care minimizează așteptarea posterioară a unei funcții de pierdere (adică așteptarea posterioară a pierderii ). Cu alte cuvinte, maximizează așteptarea posterioară a funcției de utilitate . În cadrul teoriei bayesiene , această estimare poate fi definită ca estimarea maximului a posteriori .
Să presupunem că parametrul necunoscut are o distribuție anterioară . Fie o estimare a unui parametru bazată pe unele măsurători ale , și fie o funcție de pierdere pătratică a , iar riscul bayesian al parametrului este , unde media este preluată asupra distribuției lui : aceasta definește funcția de risc ca o funcție a . Atunci o estimare bayesiană va fi numită o astfel de estimare care minimizează riscul bayesian printre toate celelalte estimări. În mod egal, estimatorul care minimizează pierderea așteptată posterior pentru fiecare x minimizează și riscul bayesian și este astfel un estimator bayesian. [unu]
În cazul unei distribuții anterioare incorecte , o estimare care minimizează așteptarea pierderii posterioare pentru fiecare x se numește estimare bayesiană generalizată . [2]
Funcția de risc cel mai frecvent utilizată pentru estimarea bayesiană este funcția de eroare pătratică medie (denumită în literatura engleză MSE). Eroarea pătratică medie minimă MSE este definită ca
unde așteptarea matematică este luată din distribuția comună și .
Dacă folosim MSE ca funcție de risc, atunci estimarea bayesiană a parametrului necunoscut este pur și simplu media distribuției posterioare : [3]
Aceasta este cunoscută sub numele de estimarea erorii medii pătratice minime. Riscul bayesian, în acest caz, este varianța posterioară.
În cazurile în care nu există niciun motiv întemeiat pentru a prefera un antecedent în detrimentul altuia, anteriorul conjugat este folosit pentru simplitate . Este definită ca o distribuție anterioară aparținând unei familii parametrice a cărei distribuție posterioară rezultată aparține și acelei familii. Aceasta este o proprietate importantă deoarece estimarea bayesiană, precum și caracteristicile sale statistice ( varianță , interval de încredere etc.) pot fi derivate din distribuția posterioară.
Este aplicabil în special în estimarea secvenţială, unde distribuţia posterioară a măsurătorilor curente este utilizată ca anterioară în măsurarea următoare. Cu fiecare nouă iterație a unor astfel de măsurători, distribuția posterioară devine de obicei mai complexă și, adesea, estimarea bayesiană nu poate fi calculată fără utilizarea metodelor numerice .
Câteva exemple de priorități conjugate:
Funcțiile de risc sunt alese în funcție de modul în care este măsurat intervalul dintre estimare și parametrul necunoscut. MSE este cea mai frecvent utilizată funcție de risc, în primul rând datorită simplității sale. Cu toate acestea, uneori sunt utilizate funcții alternative de risc. Următoarele sunt câteva exemple de astfel de alternative. În plus, funcția de distribuție generalizată posterioară este notată ca .
Mediana posterioară și alte cuantile( ):
Până acum s-a presupus că distribuția anterioară este distribuția de probabilitate adevărată, deoarece
Cu toate acestea, uneori aceasta poate fi o cerință prea strictă. De exemplu, nu există o astfel de distribuție (care acoperă întreaga mulțime R de numere reale) pentru care fiecare număr real ar fi la fel de posibil. Totuși, într-un anumit sens, o astfel de distribuție pare a fi o alegere firească pentru un prior neinformativ , adică un prior care nu favorizează o valoare fixă a parametrului necunoscut. Este încă posibil să se definească funcția , dar aceasta nu va mai fi o distribuție de probabilitate corectă, deoarece are o masă infinită.
Astfel de măsuri stabilite sunt distribuții anterioare incorecte .
Utilizarea priorităților incorecte înseamnă că riscul bayesian nu este definit (deoarece priorul dat nu este, de fapt, o distribuție de probabilitate și nu putem lua din ea valoarea așteptată ). Prin urmare, este incorect să vorbim despre un estimator bayesian care minimizează riscul bayesian. Oricum ar fi, se poate calcula distribuția posterioară ca
Rețineți că teorema lui Bayes se aplică numai distribuțiilor bine formate, deci nu este posibil să o utilizați aici. Cu toate acestea, există adesea cazuri în care distribuția posterioară rezultată va permite astfel de distribuții de probabilitate. În acest caz, pierderea posterior așteptată
bine definite și finite. Reamintim că pentru o distribuție corectă, estimările bayesiene minimizează pierderea posterioară. Când distribuția anterioară este incorectă, estimatorul care minimizează așteptarea posterioară a pierderii se numește estimator bayesian generalizat .
Estimatorii bayesieni produși prin metoda empirică Bayes sunt numiți estimatori bayesieni empirici . Această metodă permite utilizarea datelor suport în dezvoltarea unui estimator bayesian. Ele pot fi obținute empiric prin observarea parametrilor adiacenți. Acest lucru se face din ipoteza că parametrii estimați sunt luați din aceleași date anterioare. De exemplu, dacă se fac observații independente pentru diferiți parametri, uneori este posibil să se îmbunătățească eficiența estimării unui anumit parametru prin utilizarea datelor din alte observații.
Există tehnici parametrice și neparametrice pentru estimările empirice bayesiene. Cele parametrice sunt de preferat deoarece sunt mai aplicabile și mai precise pe cantități mici de date. [patru]
Regulile bayesiene care au un risc bayesian finit sunt de obicei valide. Următoarele sunt câteva exemple de teoreme de admisibilitate.
În același timp, regula bayesiană generalizată adesea nu definește riscul bayesian în cazul unei distribuții anterioare incorecte. Aceste reguli sunt adesea invalide și validarea lor poate fi dificilă. De exemplu, o estimare bayesiană generalizată a deplasării parametrului θ, bazată pe un eșantion cu o distribuție normală, este invalidă pentru . Acest paradox este cunoscut sub numele de paradoxul lui Stein. Exemplul lui
Internet Movie Database folosește o formulă specială pentru a calcula și compara evaluările filmelor de către utilizatori . Următoarea formulă bayesiană a fost utilizată inițial pentru a calcula media ponderată pentru primele 250 de filme, deși formula sa schimbat de atunci:
Unde:
= rating ponderat = evaluarea medie a filmului, exprimată ca număr de la 1 la 10 = (evaluare) = numărul de voturi pentru film = (voturi) = pondere dată de rating a priori (estimarea se bazează pe distribuția ratingului mediu între toate filmele) = evaluare medie pentru toate filmele (în prezent 7,0)Abordarea IMDB asigură că un film evaluat de câteva sute de ori exclusiv cu nota 10 nu poate urca mai sus decât, de exemplu, Nașul, care are un rating mediu de 9,2 de la peste 500.000 de utilizatori.