Prețul de stabilitate ( English price of stability , PoS ) pentru joc este raportul dintre valoarea optimă a funcției obiectiv într-una dintre stările sale de echilibru și rezultatul optim. Prețul stabilității are sens pentru jocurile care au o putere mai mare sau condiții de joc care afectează într-un fel poziția jucătorilor și îi pot ajuta să converge către echilibrul Nash . Când se măsoară eficacitatea echilibrului Nash în orice joc, este logic să luăm în considerare prețul anarhiei ( Eng. Price of Anarchy , PoA).
PoS poate fi exprimat astfel:
Aici , este valoarea celui mai bun echilibru Nash și este valoarea soluției optime.
În jocul Dilema prizonierului de mai jos , jucătorii nu vor coopera întotdeauna între ei, chiar dacă este în interesul lor, deoarece există un singur echilibru ( , ), avem .
(2,2) | (0,3) | |
(3,0) | (1,1) |
Acest exemplu este o versiune a jocului bătălia sexelor . Are două puncte de echilibru, ( , ) și ( , ) cu valorile 3 și, respectiv, 15. Valoarea optimă este 15. Apoi , în timp ce .
(2.1) | (0,0) | |
(0,0) | (5,10) |
Prețul stabilității a fost studiat pentru prima dată de A. Shultzan și N. Mozes, iar termenul în sine a apărut în lucrările lui E. Anselevich. Ei au arătat că echilibrul Nash există întotdeauna în strategiile pure, iar costul de stabilitate al acestui joc nu depășește numărul armonic a n-a în graficele direcționate. Pentru graficele nedirecționate, Anshelevich și colab. au prezentat o limită de stabilitate rigidă de 4/3 pentru cazul unei surse și a doi jucători. Yen Lee a demonstrat că pentru astfel de grafice cu destinații diferite pentru toți jucătorii, cu care toți jucătorii trebuie să aibă o conexiune, prețul unui flux de joc stabil pentru construirea unei rețele Shapley este unde este numărul de jucători. Pe de altă parte, costul anarhiei pentru joc este de aproximativ .
Jocurile de construire a rețelei au o rațiune naturală pentru prețul stabilității. În aceste jocuri, prețul anarhiei poate fi mult mai mic decât prețul stabilității.
Un exemplu din următorul joc:
Prețul anarhiei poate fi . Un exemplu al următorului joc de construire a rețelei.
Există 2 solduri diferite în acest joc. Dacă toată lumea împarte arcul , atunci costul social este . Mai mult, acest echilibru este optim. Cu toate acestea, împărțirea pe toate arcurile este, de asemenea, un echilibru Nash. Orice agent are un preț în strategia de echilibru, iar trecerea acestuia la un alt arc îi crește prețul la .
Iată un joc patologic cu același comportament, dar la prețul stabilității. Există jucători, fiecare dintre care începe din partea de sus și încearcă să-l conecteze la vârf . Să presupunem că prețurile arcurilor neetichetate sunt 0.
Strategia optimă pentru toți jucătorii este împărțirea arcului , ceea ce are ca rezultat un cost social . Cu toate acestea, există o singură strategie de echilibru Nash pentru acest joc. În cazul optimității, fiecare jucător plătește și jucătorul 1 își poate reduce prețul trecând la arcul . Dacă se întâmplă acest lucru, atunci devine profitabil pentru jucătorul 2 să treacă la arc și așa mai departe. În cele din urmă, agenții vor ajunge la un echilibru Nash plătindu-și propriul arc separat. O astfel de distribuție are un cost social , unde este numărul armonic al treilea , care este egal cu . Deși această valoare nu este plafonată, costul stabilității este exponențial mai bun decât costul anarhiei în acest joc.
Prin definiție, jocurile de construire a rețelei sunt jocuri overflow , deci permit o funcție potențială .
Teorema. [Teorema 19.13 din cartea 1] Să presupunem că există constante și astfel încât pentru orice strategie
Atunci prețul stabilității este mai mic
Dovada. Minimul global al funcției este un echilibru Nash, astfel încât
Prețul social a fost definit ca suma prețurilor peste arce, astfel încât
Trivial obținem și calculele de mai sus dau , așa că putem invoca teorema pentru limita superioară a costului de stabilitate.
Teoria jocului | |
---|---|
Noțiuni de bază | |
Tipuri de jocuri |
|
Concepte de soluție | |
Exemple de jocuri | |