Teoria jocurilor este o metodă matematică pentru studiul strategiilor optime în jocuri . Jocul este înțeles ca un proces în care participă două sau mai multe părți, luptă pentru realizarea intereselor lor. Fiecare parte are propriul său obiectiv și folosește o strategie care poate duce la o victorie sau o pierdere, în funcție de comportamentul celorlalți jucători. Teoria jocurilor ajută la alegerea celor mai bune strategii, ținând cont de ideile despre ceilalți participanți, resursele acestora și acțiunile lor posibile [1] .
Teoria jocurilor este o ramură a matematicii aplicate , mai precis , a cercetării operaționale . Cel mai adesea, metodele teoriei jocurilor sunt folosite în relațiile internaționale , economie , puțin mai rar în alte științe sociale - sociologie , științe politice , psihologie , etică , jurisprudență și altele. Din anii 1970 , a fost adoptat de biologi pentru a studia comportamentul animalului și teoria evoluției . Este foarte important pentru inteligența artificială și cibernetică , mai ales cu manifestarea interesului față de agenți inteligenți .
Soluțiile sau strategiile optime în modelarea matematică au fost propuse încă din secolul al XVIII-lea. Problemele producției și prețurilor într-un oligopol , care mai târziu au devenit exemple manuale de teoria jocurilor, au fost luate în considerare în secolul al XIX-lea. A. Cournot şi J. Bertrand . La începutul secolului XX. Emanuel Lasker , Ernst Zermelo și Emil Borel au prezentat ideea unei teorii matematice a conflictului de interese.
Teoria jocurilor matematice își are rădăcinile în economia neoclasică . Aspectele matematice și aplicațiile teoriei au fost prezentate pentru prima dată în cartea clasică din 1944 Theory of Games and Economic Behavior John von și Oscar Morgenstern [ 2 ] .
Această zonă a matematicii și-a găsit o oarecare reflectare în cultura publică. În 1998, scriitoarea și jurnalista americană Sylvia Nazar a publicat o carte [3] despre soarta lui John Forbes Nash , câștigător al Premiului Alfred Nobel Memorial în economie și om de știință în domeniul teoriei jocurilor; iar în 2001 , pe baza cărții, a fost realizat filmul „A Beautiful Mind ”. Unele emisiuni de televiziune americane, cum ar fi Friend sau Foe? , „Alias” sau „NUMB3RS”, se referă periodic la teorie în episoadele lor.
John Nash în 1949 scrie o disertație despre teoria jocurilor, 45 de ani mai târziu primește Premiul Nobel pentru economie. Nash, după ce a absolvit Institutul Politehnic Carnegie cu două diplome - o diplomă de licență și o diplomă de master - a intrat la Universitatea Princeton , unde a urmat cursurile lui John von Neumann . În scrierile sale, Nash a dezvoltat principiile „dinamicii manageriale”. Primele concepte ale teoriei jocurilor au analizat jocurile antagonice , când există învinși și jucători care au câștigat pe cheltuiala lor. Nash dezvoltă metode de analiză în care toți participanții fie câștigă, fie pierd. Aceste situații sunt numite „ echilibru Nash ”, sau „echilibru non-cooperativ”, în care părțile folosesc strategia optimă, ceea ce duce la crearea unui echilibru stabil. Este benefic pentru jucători să mențină acest echilibru, deoarece orice schimbare le va înrăutăți situația. Aceste lucrări ale lui Nash au adus o contribuție serioasă la dezvoltarea teoriei jocurilor, instrumentele matematice ale modelării economice au fost revizuite. Nash arată că abordarea clasică a competiției a lui A. Smith , când este fiecare bărbat pentru el însuși, nu este întotdeauna optimă. Strategiile sunt mai profitabile atunci când toată lumea încearcă să facă mai bine pentru ei înșiși, în timp ce face mai bine pentru ceilalți.
Deși teoria jocurilor s-a ocupat inițial de modele economice, până în anii 1950 a rămas o teorie formală în matematică. Dar din anii '50 încercările încep să aplice metodele teoriei jocurilor nu numai în economie, ci și în biologie, cibernetică , tehnologie , antropologie . În timpul celui de-al Doilea Război Mondial și imediat după acesta, armata a devenit serios interesată de teoria jocurilor, care a văzut-o ca pe un instrument puternic pentru investigarea deciziilor strategice.
În 1960-1970. interesul pentru teoria jocurilor scade, în ciuda rezultatelor matematice semnificative obținute în acel moment. De la mijlocul anilor 1980. începe utilizarea practică activă a teoriei jocurilor, în special în economie și management. În ultimii 20 - 30 de ani, importanța teoriei jocurilor și interesul pentru aceasta a crescut semnificativ, unele domenii ale teoriei economice moderne nu pot fi afirmate fără utilizarea teoriei jocurilor.
Din punct de vedere istoric, primele jocuri cu informații complete, în care este relativ ușor de analizat strategia tuturor participanților, au intrat în sfera de interes a matematicienilor. Apoi, atenția cercetătorilor a fost atrasă de „jocuri cu informații incomplete”. După ce au analizat pokerul și alte jocuri din această clasă, matematicienii au încercat să aplice aparatul matematic la jocuri de „scală globală” - războaie, economie și chiar divorțuri obișnuite.
Teoria jocurilor matematice se dezvoltă acum rapid, jocurile dinamice sunt luate în considerare. Cu toate acestea, aparatul matematic al teoriei jocurilor este scump [4] . Este folosit pentru sarcini legitime: politică, economia monopolurilor și distribuția puterii de piață etc. O serie de oameni de știință cunoscuți au devenit laureați ai Nobel în economie pentru contribuția lor la dezvoltarea teoriei jocurilor, care descrie socio-economice. proceselor. J. Nash, datorită cercetărilor sale în teoria jocurilor, a devenit unul dintre experții de top în domeniul conducerii „ Războiului Rece ”, ceea ce confirmă amploarea sarcinilor cu care se ocupă teoria jocurilor.
Câștigătorii Premiului Alfred Nobel Memorial pentru economie pentru realizările în teoria jocurilor și teoria economică sunt: Robert Aumann , Reinhard Selten , John Nash , John Harsanyi , William Vickrey , James Mirrlees , Thomas Schelling , George Akerlof , Michael Spence , Joseph Stiglitz , Leonid Hurwitz , Eric Maskin , Roger Myerson , Lloyd Shapley , Alvin Roth , Jean Tyrol , Paul Milgrom , Robert Wilston .
Jocurile sunt obiecte matematice strict definite. Jocul este format din jucători, un set de strategii pentru fiecare jucător și o indicație a câștigurilor, sau a câștigurilor , ale jucătorilor pentru fiecare combinație de strategii. Majoritatea jocurilor cooperative sunt descrise printr-o funcție caracteristică, în timp ce pentru alte tipuri, forma normală sau extensivă este mai des folosită. Caracteristicile jocului ca model matematic al situației:
Jocurile în formă extinsă [5] sunt reprezentate ca un arbore dirijat , unde fiecare vârf corespunde situației în care jucătorul își alege strategia. Fiecărui jucător i se atribuie un întreg nivel de vârfuri. Plățile sunt înregistrate în partea de jos a arborelui, sub fiecare nod de frunză .
Imaginea arată un joc pentru doi jucători. Jucătorul 1 merge primul și alege strategia F sau U. Jucătorul 2 își analizează poziția și decide dacă alege strategia A sau R. Cel mai probabil, primul jucător va alege U, iar al doilea - A (pentru fiecare dintre ele acestea sunt strategii optime ); atunci vor primi 8 și respectiv 2 puncte.
Forma extinsă este foarte ilustrativă, este utilă mai ales pentru reprezentarea jocurilor cu mai mult de doi jucători și a jocurilor cu mișcări consecutive. Dacă participanții fac mișcări simultane, atunci vârfurile corespunzătoare sunt fie conectate printr-o linie punctată, fie conturate de o linie continuă.
Strategia jucătorului 2 1 |
Strategia jucătorului 2 2 | |
Jucătorul 1 Strategia 1 |
4 , 3 | -1 , -1 |
Strategia jucătorului 1 2 |
0 , 0 | 3 , 4 |
Forma normală pentru un joc cu 2 jucători, fiecare cu 2 strategii. |
Într-o formă normală sau strategică, jocul este descris de matricea plăților . [6] Fiecare parte (mai precis, dimensiune) a matricei este un jucător, rândurile definesc strategiile primului jucător, iar coloanele definesc strategiile celui de-al doilea. La intersecția celor două strategii, puteți vedea câștigurile pe care le vor primi jucătorii. În exemplul din dreapta, dacă jucătorul 1 alege prima strategie și jucătorul 2 alege a doua strategie, atunci vedem (−1, −1) la intersecție, ceea ce înseamnă că ambii jucători au pierdut câte un punct fiecare ca urmare a mutare.
Jucătorii au ales pentru ei înșiși strategii cu rezultat maxim, dar au pierdut din cauza neștiinței mișcării celuilalt jucător. De obicei, forma normală reprezintă jocuri în care mișcările sunt făcute simultan , sau cel puțin se presupune că toți jucătorii nu știu ce fac ceilalți participanți. Astfel de jocuri cu informații incomplete vor fi luate în considerare mai jos.
În jocurile de cooperare cu utilitate transferabilă , adică capacitatea de a transfera fonduri de la un jucător la altul, este imposibil să se aplice conceptul de plăți individuale . În schimb, se folosește așa-numita funcție caracteristică, care determină profitul fiecărei coaliții de jucători. Se presupune că profitul coaliției goale este zero.
Bazele acestei abordări pot fi găsite în cartea lui von Neumann și Morgenstern. Studiind forma normală pentru jocurile de coaliție, ei au motivat că, dacă o coaliție C este formată într-un joc cu două părți, atunci coaliția N \ C i se opune . Pare un joc pentru doi jucători. Dar, deoarece există multe variante de coaliții posibile (și anume, 2 N , unde N este numărul de jucători), câștigul pentru C va fi o valoare caracteristică în funcție de componența coaliției. Formal, un joc sub această formă (numit și joc TU [7] ) este reprezentat de o pereche (N, v) , unde N este mulțimea tuturor jucătorilor și v : 2 N → R este funcția caracteristică.
Această formă de prezentare poate fi aplicată tuturor jocurilor, inclusiv celor fără utilitate transferabilă. În prezent, există modalități de a converti orice joc din formă normală în formă caracteristică, dar transformarea în direcția opusă nu este posibilă în toate cazurile.
Teoria jocurilor ca una dintre abordările din matematica aplicată este folosită pentru a studia comportamentul oamenilor și animalelor în diferite situații. Inițial, teoria jocurilor a început să se dezvolte în cadrul științei economice, făcând posibilă înțelegerea și explicarea comportamentului agenților economici în diverse situații. Mai târziu, domeniul de aplicare al teoriei jocurilor a fost extins la alte științe sociale; În prezent, teoria jocurilor este folosită pentru a explica comportamentul uman în științe politice, sociologie și psihologie. Analiza teoretică a jocurilor a fost folosită pentru prima dată pentru a descrie comportamentul animalelor de către Ronald Fisher în anii 1930 (deși chiar și Charles Darwin a folosit ideile de teoria jocurilor fără justificare formală). Termenul „teoria jocurilor” nu apare în lucrarea lui Ronald Fisher. Cu toate acestea, munca se desfășoară în esență în conformitate cu analiza teoretică a jocului. Dezvoltarile realizate in economie au fost aplicate de John Maynard Smith in cartea Evolution and Game Theory. Teoria jocurilor nu este folosită doar pentru a prezice și explica comportamentul; s-au făcut încercări de a folosi teoria jocurilor pentru a dezvolta teorii ale comportamentului etic sau de referință. Economiștii și filozofii au folosit teoria jocurilor pentru a înțelege mai bine comportamentul bun.
Inițial, teoria jocurilor a fost folosită pentru a descrie și modela comportamentul populațiilor umane. Unii cercetători consideră că prin determinarea echilibrului în jocurile corespunzătoare, pot prezice comportamentul populațiilor umane într-o situație de confruntare reală. Această abordare a teoriei jocurilor a fost recent criticată din mai multe motive. În primul rând, ipotezele utilizate în simulări sunt adesea încălcate în viața reală. Cercetătorii pot presupune că jucătorii aleg comportamente care își maximizează beneficiul total (modelul omului economic), dar, în practică, comportamentul uman nu se potrivește adesea cu această premisă. Există multe explicații pentru acest fenomen - iraționalitate, modelarea discuțiilor și chiar diferite motive ale jucătorilor (inclusiv altruismul ). Autorii modelelor teoretice ale jocurilor obiectează la acest lucru spunând că ipotezele lor sunt similare cu cele din fizică. Prin urmare, chiar dacă ipotezele lor nu sunt întotdeauna îndeplinite, teoria jocurilor poate fi folosită ca model ideal rezonabil, prin analogie cu aceleași modele din fizică. Cu toate acestea, un nou val de critici a căzut asupra teoriei jocurilor când, în urma experimentelor, s-a dezvăluit că oamenii nu urmează strategiile de echilibru în practică. De exemplu, în jocurile Centipede și Dictator, participanții adesea nu folosesc profilul de strategie care constituie echilibrul Nash. Dezbaterea continuă cu privire la semnificația unor astfel de experimente. Conform unui alt punct de vedere, echilibrul Nash nu este o predicție a comportamentului așteptat, ci doar explică de ce populațiile care sunt deja în echilibru Nash rămân în această stare. Cu toate acestea, întrebarea cum ajung aceste populații la echilibrul Nash rămâne deschisă. Unii cercetători în căutarea unui răspuns la această întrebare au trecut la studiul teoriei jocurilor evolutive. Modelele evolutive ale teoriei jocurilor presupun raționalitatea sau iraționalitatea limitată a jucătorilor. În ciuda numelui, teoria jocurilor evoluționiste nu este atât de preocupată de selecția naturală a speciilor. Această ramură a teoriei jocurilor studiază modele de evoluție biologică și culturală, precum și modele ale procesului de învățare.
Pe de altă parte, mulți cercetători consideră teoria jocurilor nu ca un instrument de predicție a comportamentului, ci ca un instrument de analiză a situațiilor pentru a identifica cel mai bun comportament pentru un jucător rațional. Deoarece echilibrul Nash include strategii care răspund cel mai bine la comportamentul altui jucător, utilizarea conceptului de echilibru Nash pentru a alege comportamentul pare a fi destul de rezonabilă. Cu toate acestea, această utilizare a modelelor teoretice de joc a fost, de asemenea, criticată. În primul rând, în unele cazuri, este avantajos pentru un jucător să aleagă o strategie care nu este în echilibru dacă se așteaptă ca și alți jucători să nu urmeze strategiile de echilibru. În al doilea rând, celebrul joc Prisoner's Dilemma ne permite să dăm un alt contraexemplu. În Dilema Prizonierului, urmărirea interesului propriu are ca rezultat ambii jucători într-o situație mai proastă decât s-ar afla în sacrificarea interesului propriu.
Jocul se numește cooperativ, sau coaliție , dacă jucătorii se pot uni în grupuri, asumându-și anumite obligații față de alți jucători și coordonându-și acțiunile. Prin aceasta se deosebește de jocurile necooperante în care fiecare este obligat să joace pentru sine. Jocurile distractive sunt rareori cooperante, dar astfel de mecanisme nu sunt neobișnuite în viața de zi cu zi.
Se presupune adesea că jocurile cooperative diferă tocmai în capacitatea jucătorilor de a comunica între ei. În general, acest lucru nu este adevărat. Există jocuri în care comunicarea este permisă, dar jucătorii urmăresc obiective personale și invers.
Dintre cele două tipuri de jocuri, cele non-cooperante descriu situații în detaliu și produc rezultate mai precise. Cooperativele iau în considerare procesul jocului ca întreg. Încercările de a combina cele două abordări au dat rezultate considerabile. Așa-numitul program Nash a găsit deja soluții pentru unele jocuri cooperative ca situații de echilibru pentru jocurile non-cooperative.
Jocurile hibride includ elemente ale jocurilor cooperative și non-cooperative. De exemplu, jucătorii pot forma grupuri, dar jocul se va juca într-un stil necooperant. Aceasta înseamnă că fiecare jucător va urmări interesele grupului său, încercând în același timp să obțină câștig personal.
DAR | B | |
DAR | 12 | 0, 0 |
B | 0, 0 | 12 |
Joc asimetric |
Jocul va fi simetric atunci când strategiile corespunzătoare ale jucătorilor sunt egale, adică au aceleași câștiguri. Cu alte cuvinte, dacă jucătorii pot schimba locul și, în același timp, câștigurile lor pentru aceleași mișcări nu se vor schimba. Multe dintre jocurile studiate pentru doi jucători sunt simetrice. În special, acestea sunt: „ Dilema prizonierului ”, „ Vânătoarea de căprioare ”, „ Șoimi și porumbei ”. [8] Ca jocuri asimetrice, se pot cita „ Ultimatum ” sau „ Dictator ”.
În exemplul din dreapta, jocul la prima vedere poate părea simetric datorită strategiilor similare, dar nu este așa - la urma urmei, câștigul celui de-al doilea jucător cu profilurile de strategie (A, A) și (B, B) va fi mai mare decât cea a primei.
DAR | B | |
DAR | −1, 1 | 3, -3 |
B | 0, 0 | −2, 2 |
Joc cu sumă zero |
Jocurile cu sumă zero sunt un tip special de jocuri cu sumă constantă , adică acelea în care jucătorii nu pot crește sau reduce resursele disponibile sau fondul jocului. În acest caz, suma tuturor câștigurilor este egală cu suma tuturor pierderilor din orice mișcare. Uită-te la tabel - numerele reprezintă plăți către jucători - iar suma lor din fiecare celulă este zero. Exemple de astfel de jocuri sunt pokerul , unde unul câștigă toate pariurile celorlalți; reversi , unde piesele adversarului sunt capturate; sau furt simplu .
Multe jocuri studiate de matematicieni, inclusiv Dilema Prizonierului deja menționată, sunt de alt fel: în jocurile cu sumă diferită de zero, câștigarea unui jucător nu înseamnă neapărat pierderea celuilalt și invers. Rezultatul unui astfel de joc poate fi mai mic sau mai mare decât zero. Astfel de jocuri pot fi convertite la sumă zero prin introducerea unui jucător fictiv care „își însușește” surplusul sau compensează lipsa fondurilor. [9]
Un alt joc cu o sumă diferită de zero poate fi tranzacționarea , de unde beneficiază fiecare participant. Un exemplu larg cunoscut în care scade este războiul .
În jocurile paralele, jucătorii se mișcă în același timp, sau cel puțin nu sunt conștienți de alegerile celorlalți până când fiecare și-a făcut mișcarea. În jocurile secvenţiale sau dinamice , participanţii pot face mişcări într-o ordine predeterminată sau aleatorie, dar, făcând aceasta, primesc unele informaţii despre acţiunile anterioare ale altora. Este posibil ca aceste informații să nu fie complet complete , de exemplu, un jucător poate afla că adversarul său nu a ales exact a cincea dintre cele zece strategii ale sale, fără să învețe nimic despre celelalte.
Diferențele în reprezentarea jocurilor paralele și secvenţiale au fost discutate mai sus. Primele sunt de obicei prezentate în formă normală, în timp ce cele din urmă sunt în formă extinsă.
Un subset important de jocuri secvențiale sunt jocurile de informații perfecte . Într-un astfel de joc, participanții cunosc toate mișcările realizate până la momentul actual, precum și posibilele strategii ale adversarilor, ceea ce le permite să prezică evoluția ulterioară a jocului. Un exemplu de joc cu informații perfecte este damele și șahul. Informațiile perfecte nu sunt disponibile în jocurile paralele, deoarece mișcările curente ale adversarilor nu sunt cunoscute în ele. Adesea conceptul de informație perfectă este confundat cu informații similare - complete . Pentru cei din urmă, doar cunoașterea tuturor strategiilor disponibile adversarilor este suficientă, cunoașterea tuturor mișcărilor lor nu este necesară [10] [11] [12] . Cu toate acestea, multe dintre jocurile studiate la matematică sunt jocuri cu informații incomplete, în care nu se știe ce strategie a ales jucătorul: „ Dilema prizonierului ” sau „ Compararea monedelor ”. În același timp, există exemple interesante de jocuri în care, în cazul general, jucătorii au informații complete: „ Ultimatum ”, „ Centipede ”.
Jocurile din lumea reală sau jocurile studiate în economie tind să dureze un număr finit de mișcări. Matematica nu este atât de limitată și, în special, teoria mulțimilor se ocupă de jocuri care pot continua la nesfârșit . Mai mult decât atât, câștigătorul și câștigurile sale nu sunt determinate până la sfârșitul tuturor mișcărilor.
Sarcina care se pune de obicei în acest caz nu este de a găsi soluția optimă, ci de a găsi cel puțin o strategie câștigătoare . Folosind axioma alegerii , se poate demonstra că, uneori, chiar și pentru jocurile cu informații complete și două rezultate - „câștigă” sau „pierde” – niciunul dintre jucători nu are o astfel de strategie. Existența unor strategii câștigătoare pentru anumite jocuri special concepute are un rol important în teoria descriptivă a mulțimilor .
Majoritatea jocurilor studiate sunt discrete : au un număr finit de jucători, mișcări, evenimente, rezultate etc. Cu toate acestea, aceste componente pot fi extinse la un set de numere reale . Jocurile care includ astfel de elemente sunt adesea numite jocuri diferențiale. Ele sunt asociate cu o scară reală (de obicei - scara timpului), deși evenimentele care au loc în ele pot fi de natură discretă. Jocurile diferențiale sunt considerate și în teoria optimizării , își găsesc aplicația în inginerie și tehnologie , fizică .
Acestea sunt jocuri care au ca rezultat un set de reguli pentru un alt joc (numit joc țintă sau obiect ). Scopul metagamelor este de a crește utilitatea setului de reguli care este oferit. Teoria metagamelor este legată de teoria mecanismului optim .
Studiul jocurilor secvențiale cu informații perfecte și seturi relativ complexe de strategii posibile este separat într-o zonă separată numită teoria jocurilor combinatorii (sau teoria jocurilor combinatorii). Această teorie funcționează cu instrumente precum funcția Sprague-Grundy . Terenul a fost în mare parte modelat de John Conway , Alvin Berlekamp și Richard Guy în On Numbers and Games and Winning Ways for your Mathematical Plays.
Dicționare și enciclopedii | ||||
---|---|---|---|---|
|
Teoria jocului | |
---|---|
Noțiuni de bază | |
Tipuri de jocuri |
|
Concepte de soluție | |
Exemple de jocuri | |
Ramuri ale matematicii | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Portalul „Știință” | ||||||||||
Bazele matematicii teoria multimilor logica matematica algebra logicii | ||||||||||
Teoria numerelor ( aritmetică ) | ||||||||||
| ||||||||||
| ||||||||||
| ||||||||||
| ||||||||||
| ||||||||||
|