Teoria Dempster-Schafer este o teorie matematică a dovezilor ([SH76]) bazată pe funcții de credință și raționament plauzibil , care sunt folosite pentru a combina informații (dovezi) separate pentru a calcula probabilitatea unui eveniment. Teoria a fost dezvoltată de Arthur P. Dempster și Glenn Schafer .
Primul joc este o aruncare de monede, în care se pariază dacă va apărea cap sau cozi. Acum imaginați-vă un al doilea joc în care sunt pariate pe rezultatul unei lupte dintre cel mai bun boxer din lume și cel mai bun luptător din lume. Să presupunem că nu cunoaștem artele marțiale și că ne este foarte greu să decidem pe cine să pariem.
Mulți oameni vor fi mai puțin încrezători în situația celui de-al doilea joc, în care probabilitățile sunt necunoscute, decât în primul joc, unde este ușor de observat că probabilitatea fiecărui rezultat este jumătate. În cazul celui de-al doilea joc, teoria bayesiană va atribui jumătate din probabilitate fiecărui rezultat, indiferent de informațiile care fac ca unul dintre rezultate să fie mai probabil decât celălalt. Teoria Dempster-Schafer vă permite să determinați gradul de încredere al jucătorului în ceea ce privește probabilitățile atribuite diferitelor rezultate.
Fie mulțimea universală , mulțimea tuturor afirmațiilor luate în considerare. Mulțimea exponențială, , este colecția tuturor submulților ale mulțimii , inclusiv mulțimea goală . De exemplu, dacă:
apoi
Prin definiție, masa mulțimii goale este zero:
Masele elementelor rămase ale mulțimii exponențiale sunt normalizate la o sumă unitară:
Masa unui element din mulțimea exponențială exprimă raportul dintre toate dovezile relevante și disponibile care susțin afirmația că un anumit element aparține , dar nu aparține niciunui submulțime de . Cantitatea se referă numai la mulțime și nu creează declarații suplimentare despre celelalte submulțimi , fiecare dintre ele, prin definiție, având propria sa masă.
Pe baza maselor alocate, este posibil să se determine limitele superioare și inferioare ale gamei de posibilități. Acest interval conține valoarea exactă a probabilității submulțimii luate în considerare (în sensul clasic) și este limitat de două măsuri continue non-aditive numite credință ( sau suport ) și plauzibilitate ( plauzibilitate ) :
Încrederea mulțimii este definită ca suma tuturor maselor de submulțimi proprii ale mulțimii luate în considerare:
Probabilitatea este suma maselor tuturor mulțimilor care se intersectează cu mulțimea luată în considerare :
Aceste două măsuri sunt legate între ele după cum urmează:
Din cele de mai sus rezultă că este suficient să cunoașteți cel puțin una dintre măsuri (masă, încredere sau probabilitate) pentru a calcula celelalte două.
Luați în considerare problema combinării a două seturi independente de mase atribuite. Regula de unire originală, cunoscută sub numele de regula de combinare a lui Dempster , este o generalizare a regulii lui Bayes. Această regulă subliniază acordul între mai multe surse și ignoră toate dovezile contradictorii prin normalizare. Legalitatea utilizării acestei reguli este serios pusă la îndoială în cazul unor inconsecvențe semnificative între sursele de informații.
De fapt, uniunea (numită masă adăugată ) este calculată din două seturi de mase și după cum urmează:
Unde:
este o măsură a conflictului dintre două seturi de mase. Factorul de normalizare, , corespunde ignorării completă a inconsistențelor și atribuirii unui set gol oricărei mase corespunzătoare unui conflict. Prin urmare, această operațiune duce la rezultate contraintuitive în cazul unui conflict semnificativ în anumite circumstanțe.
Abordarea lui Shafer ne permite să interpretăm încrederea și probabilitatea ca limite ale intervalului valorii posibile a adevărului ipotezei:
încredere ≤ o anumită măsură a adevărului ≤ plauzibilitate .Se presupune că:
Încrederea în ipoteză = {suma maselor de dovezi care susțin fără echivoc ipoteza}. Probabilitate = 1 − {suma maselor tuturor dovezilor care contrazic ipoteza}.De exemplu, să presupunem că avem ipoteza „pisica din cutie este moartă”. Dacă pentru ea încrederea este de 0,5 și probabilitatea este de 0,8, atunci aceasta înseamnă că avem dovezi (cu o greutate totală de 0,5) care indică fără echivoc că pisica este moartă; dar există și dovezi (cu o greutate totală de 0,2) care indică fără ambiguitate că pisica este în viață (probabilitatea „pisica este moartă” = 1 − 0,2 = 0,8). Masa rămasă (completând 0,5 și 0,2 la 1,0), care este, de asemenea, decalajul dintre probabilitatea de 0,8 și încrederea de 0,5, corespunde „incertitudinii” (ipotezei „universale”), prezenței dovezilor că există cu siguranță o pisică în cutie, dar fără să spună nimic despre faptul că este viu sau mort.
În total, intervalul [0,5; 0,8] caracterizează incertitudinea adevărului ipotezei inițiale, pe baza dovezilor disponibile.
Ipoteză | Greutate | Încredere | Plauzibilitatea |
---|---|---|---|
Zero (fără pisică) | 0 | 0 | 0 |
În viaţă | 0,2 | 0,2 | 0,5 |
Mort | 0,5 | 0,5 | 0,8 |
Universal (fie viu, fie mort) | 0,3 | 1.0 | 1.0 |
Ponderea ipotezei „nule” este stabilită la 0 prin definiție (corespunde cazurilor de „nicio decizie” sau unei contradicții de nerezolvat între dovezi). Acest lucru duce la faptul că încrederea în ipoteza „nulă” este 0, iar probabilitatea ipotezei „universale” este 1. Deoarece masa ipotezei „universale” este calculată din masele celor „vii” și „ ipoteze moarte”, atunci încrederea sa este automat egală cu 1, iar probabilitatea ipotezei nule este 0.
Să luăm un exemplu puțin mai complex care demonstrează caracteristicile încrederii și plauzibilității. Să presupunem că folosim un set de detectoare pentru a înregistra un singur semnal de incendiu la distanță, care poate fi una dintre cele trei culori (roșu, galben sau verde):
Ipoteză | Greutate | Încredere | Plauzibilitatea |
---|---|---|---|
Zero | 0 | 0 | 0 |
roșu | 0,35 | 0,35 | 0,56 |
Galben | 0,25 | 0,25 | 0,45 |
Verde | 0,15 | 0,15 | 0,34 |
Roșu sau Galben | 0,06 | 0,66 | 0,85 |
Roșu sau Verde | 0,05 | 0,55 | 0,75 |
Galben sau Verde | 0,04 | 0,44 | 0,65 |
universal | 0,10 | 1.00 | 1.00 |
unde, de exemplu:
Încredere (Roșu sau Galben) = Masă (Ipoteza Nulă) + Masă (Roșu) + Masă (Galben) + Masă (Roșu sau Galben) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Probabilitate (roșu sau galben) = 1 − Încredere (negare roșu sau galben) = 1 − Încredere (verde) = 1 − Masă (ipoteză nulă) − Masă (verde) = 1 − 0 − 0,15 = 0,85Evenimentele acestei mulțimi nu trebuie considerate ca intersecția evenimentelor din spațiul probabilității, deoarece sunt date în spațiul de masă. Este mai corect să considerăm evenimentul „Roșu sau Galben” ca uniunea evenimentelor „Roșu” și „Galben” și (vezi axiomele teoriei probabilităților) P(Roșu sau Galben) ≥ P(Galben) și P (Universal) = 1, unde ipoteza „Universal” corespunde „Roșu”, „Galben” sau „Verde”. În TDS, masa ipotezei „Universal” corespunde unei dovezi care nu poate fi atribuită nici unei alte ipoteze; adică o dovadă care susține că a existat un fel de semnal, dar nu vorbește deloc despre culoarea lui.
În acest exemplu, dovezilor „Roșu sau Verde” i se atribuie o masă de 0,05. Astfel de dovezi ar putea fi obținute, de exemplu, de la persoane cu orbire roșie/verde. TDS ne permite să luăm în considerare astfel de dovezi într-un mod echilibrat.