Echilibru Nash | |
---|---|
Conceptul de decizie în teoria jocurilor | |
Seturi de decizii aferente | |
Superseturi |
Raționalizare Echilibru corelat ε-echilibru |
Subseturi |
Echilibru perfect sub-joc Echilibru cu strângere de mână Strategie stabilă evolutiv Echilibru puternic |
Date | |
Paternitatea | John Nash |
Aplicație | Toate jocurile non-cooperante |
Echilibrul Nash este conceptul de decizie , unul dintre conceptele cheie ale teoriei jocurilor . Acesta este numele unui set de strategii dintr-un joc pentru doi sau mai mulți jucători în care niciun participant nu poate crește profitul schimbându-și strategia dacă ceilalți participanți nu își schimbă strategiile [1] . John Nash a dovedit existența unui astfel de echilibru în strategiile mixte în orice joc finit.
Acest concept a fost folosit pentru prima dată de Antoine Auguste Cournot . El a arătat cum să găsim ceea ce numim echilibrul Nash în jocul Cournot . Nash a fost primul care a demonstrat că un astfel de echilibru trebuie să existe pentru toate jocurile finite cu orice număr de jucători. Acest lucru a fost făcut în disertația sa despre jocurile non-cooperative în 1950.
Înainte de Nash, acest lucru a fost dovedit doar pentru jocurile cu sumă zero pentru 2 jucători de către John von Neumann și Oskar Morgenstern (1947).
Să presupunem că este un joc necooperativ cu n jucători în formă normală, unde S este setul de strategii pure și H este setul de câștiguri. Când fiecare jucător alege o strategie din profilul strategiei, jucătorul i câștigă. Rețineți că câștigul depinde de întregul profil al strategiei: nu numai de strategia aleasă de jucătorul i , ci și de alte strategii , adică de toate strategiile pentru . Profilul strategiei este un echilibru Nash dacă schimbarea strategiei sale de la la nu este profitabilă pentru niciun jucător , adică pentru niciun jucător.
Un joc poate avea un echilibru Nash în strategii pure sau în strategii mixte (adică alegerea unei strategii pure stocastic la o frecvență fixă). Nash a demonstrat că, dacă sunt permise strategii mixte , atunci va exista cel puțin un echilibru Nash în fiecare joc de n jucători.
În teoria sociologică a alegerii raționale , se subliniază separat faptul că starea stabilă a societății (echilibrul social) poate diferi de cea optimă (optimul social). Astfel de stări suboptime, dar stabile, sunt numite echilibru Nash în sociologie.
Actorul B | |||
---|---|---|---|
unu | 2 | ||
Actorul A | unu | A: +1, B: +1 | A: -1, B: +2 |
2 | A: +2, B: -1 | A: 0, B: 0 |
Tabelul din stânga arată structura acțiunii în termeni de teoria jocurilor , întocmită pentru doi actori ( actori ). Fiecare actor are două opțiuni de acțiune, indicate de cifrele 1 și 2. Coeficienții de recompensă pe care îi primesc la alegerea anumitor opțiuni de acțiune sunt indicați în celulele corespunzătoare din tabel. Să presupunem că ambii actori folosesc în prezent acțiunea 2 și că recompensele lor sunt, respectiv, zero. Alegând acțiunea 1, actorul A își va înrăutăți propria situație cu o poziție (A: −1, B: +2). În mod similar, actorul B care alege singur opțiunea 1, în timp ce actorul A continuă să folosească opțiunea 2, nu va face decât să-și agraveze situația (A: +2, B: -1). Astfel, în ciuda faptului că ambii actori înțeleg că situația ar fi optimă pentru ei atunci când ambii folosesc acțiunea 1 (recompensa - A: +1, B: +1), niciunul dintre ei nu are un motiv pentru a schimba situația și echilibrul rezultă din absenţa unor astfel de motive. Dacă sistemul este deja într-o stare optimă (când ambii actori au ales acțiunea 1), atunci ambii vor fi întotdeauna tentați să înceapă să folosească acțiunea 2, ceea ce le va aduce o recompensă în detrimentul celuilalt jucător. Acest exemplu ilustrează posibilitatea a două stări sociale: stabilă, dar suboptimală (ambele actori folosesc opțiunea 2); precum și al doilea optim, dar instabil (ambele actori folosesc opțiunea 1). [2]
Pentru a explica diferite fenomene din teoria politică , este adesea folosit conceptul de nucleu , care este o versiune mai slabă a echilibrului Nash. Un nucleu este un ansamblu de stări, în fiecare dintre ele, niciun grup de actori capabili să construiască un nou stat (absent în nucleul dat) nu își va îmbunătăți situația în comparație cu starea lor în nucleul dat. [2]
În industrie există două firme nr. 1 și nr. 2. Fiecare dintre firme poate stabili două niveluri de preț: „ridicat” și „scăzut”. Dacă ambele firme aleg prețuri mari, atunci fiecare va obține un profit de 3 milioane. Dacă ambele aleg prețuri mici, atunci fiecare va primi 2 milioane. Cu toate acestea, dacă una alege un mare și cealaltă scăzut, atunci a doua va primi 4 milioane și primul doar 1 milion Varianta cea mai avantajoasă în total este alegerea simultană a prețurilor mari (suma = 6 milioane). Totuși, această stare (în absența unui cartel ) este instabilă din cauza oportunității de câștig relativ care se deschide pentru o firmă care se abate de la această strategie. Prin urmare, ambele companii sunt cel mai probabil să aleagă prețuri mici. Deși această opțiune nu oferă câștigul total maxim (sumă = 4 milioane), ea exclude câștigul relativ al concurentului, pe care l-ar putea obține prin abaterea de la strategia reciproc optimă. Această situație se numește „echilibru Nash” [3] .
În modelul oligopolului Stackelberg , pentru două firme care participă la un joc non-cooperativ, se poate presupune că există două strategii: 1. duopolistul Cournot (K) și duopolistul Stackelberg (S), adică un strateg S. Astfel, următoarele strategii sunt posibile pentru doi jucători:
(K1;K2) (K1;S2);(K2;S1);(S1;S2). Din construcția modelului de profit la alegerea unei strategii S: , și la alegerea unei strategii K: , este clar că profitul maxim al primului jucător se realizează în situația (S1;K2), iar al doilea ( K1;S2). Deoarece aceste situații sunt incompatibile, adică nu pot fi realizate simultan, ambii jucători nu pot obține câștigul maxim în același timp. În acest caz, comportamentul optim al ambilor jucători va fi alegerea strategiei S, deoarece în acest caz strategia S este mai bună decât strategia K în ceea ce privește câștigul minim posibil. În acest caz, alegerea (S1;S2) este echilibrul Nash. O abatere unilaterală de la această strategie reduce automat câștigul oricăruia dintre jucători, în timp ce câștigul total în acest tip de echilibru este mai mic decât câștigul total la alegerea strategiei (K1;K2) de către ambii jucători. Totuși, în condițiile acestui model, în absența schimbului de informații între jucători, abaterea de la echilibrul Nash nu se va realiza din cauza riscului crescut ca al doilea jucător să poată profita de situație și să nu aleagă strategia K.
Conceptul de distrugere reciprocă asigurată . Niciuna dintre părțile care dețin arme nucleare nu poate declanșa un conflict cu impunitate sau poate dezarma unilateral.
Teoria jocului | |
---|---|
Noțiuni de bază | |
Tipuri de jocuri |
|
Concepte de soluție | |
Exemple de jocuri | |