AlphaGo vs. Lee Sedol (sau Google DeepMind Challenge Match ) a fost un meci go -go între 9 și 15 martie 2016 între programul pentru computer AlphaGo de la Google DeepMind și Lee Sedol , un profesionist coreean 9-dan . S-au jucat în total 5 jocuri. Jocul a fost jucat conform regulilor chinezești, valoarea komi a fost de 7,5 puncte. Controlul timpului este clasic - fiecărui jucător i se acordă două ore și 3 byoyomi de 60 de secunde pe joc. AlphaGo a folosit 1920 de procesoare și 280 de GPU care rulează într- o rețea distribuită [1] . Jocurile au fost transmise în direct pe YouTube [2] . Meciul s-a încheiat cu victoria lui AlphaGo cu scorul de 4:1 [3] [4] . Evenimentul a fost comparat cu meciul istoric de șah din 1997 dintre Deep Blue și Garry Kasparov , care a pecetluit într-o oarecare măsură soarta șahului [5] [6] [7] .
Câștigătorul meciului urma să primească o recompensă de 1 milion de dolari; întrucât AlphaGo a fost câștigătorul, Google DeepMind a spus că premiul în bani va fi donat unor cauze caritabile, inclusiv UNICEF și organizații de acces [8] . Lee Sedol a primit 170.000 $ (150.000 $ pentru participare și încă 20.000 $ pentru câștigarea unuia dintre jocuri) [9] .
După câștigarea meciului, Asociația Korea Paduk a acordat AlphaGo cel mai înalt rang de go, „al 9-lea dan onorific ”, pentru „eforturile sincere” ale programului în stăpânirea jocului [10] .
Go este un joc de masă complex care necesită, pe lângă logică, utilizarea intuiției, a gândirii creative și strategice [11] [12] . Multă vreme, a fost extrem de dificil să înveți programe de calculator să joace Go la nivelul unui amator puternic [13] . În comparație cu șahul , în go, inteligenței artificiale i se atribuie mai multe sarcini, a căror rezolvare necesită imitarea procesului gândirii umane [14] . În 1965, matematicianul Irving John Goode a scris:
Mergi pe computer? - Pentru a programa un computer pentru a juca un joc semnificativ de Go, și nu doar pentru a juca după reguli, este necesar să se oficializeze principiile unei bune strategii sau să creeze un program de învățare. Principiile jocului de go sunt mai bune și mai misterioase decât cele ale șahului și depind mai mult de judecățile de valoare. Prin urmare, cred că este și mult mai dificil să creezi un program de calculator care să joace Go inteligent decât un program de șah [15] .
Până în 2015 [16] , cele mai bune programe Go nu puteau ajunge decât la nivelul de amator dan [17] . Computerul s-a descurcat mai bine pe placa 9x9, unde unele programe au reușit să depășească jucătorii profesioniști. Înainte de apariția AlphaGo, unii dezvoltatori susțineau că computerele nu vor fi niciodată capabile să-i învingă pe cei mai buni jucători umani [18] . Elon Musk , unul dintre primii investitori ai Deepmind, a declarat în 2016 că, potrivit experților, inteligența artificială este la 10 ani de a-i învinge pe cei mai buni dintre jucătorii profesioniști [19] .
Meciul lui AlphaGo împotriva lui Lee Sedol poate fi comparat cu meciul de șah din 1997 dintre programul Deep Blue și Garry Kasparov , unde victoria programului IBM asupra campionului în vigoare a devenit punctul de plecare simbolic al unei noi ere în care computerele i-au depășit pe oameni în șah [20]. ] .
AlphaGo are diferențe semnificative față de programele sale predecesoare. Utilizează rețele neuronale , unde estimările euristice nu se bazează pe valori specifice ale variabilelor codificate de oameni, ci sunt extrase în mare măsură de programul însuși, prin zeci de milioane de vizualizări ale jocurilor jucate și ale propriilor jocuri cu sine [16] [21 ]. ] [22] . Nici chiar echipa de dezvoltare AlphaGo în sine nu este capabilă să specifice cum AlphaGo evaluează poziția în joc și își alege următoarea mișcare [23] . Metoda Monte Carlo a devenit, de asemenea, una dintre principalele modalități de creștere a eficienței programului în alegerea mișcărilor. La crearea programului s-au folosit date din teoria recunoașterii modelelor și a învățării automate [16] .
La începutul lui 2016, au fost publicate materiale că, în octombrie 2015, AlphaGo l-a învins de trei ori campion european la Go Fan Hui (al 2-lea dan profesionist) cu scorul de 5-0; astfel, pentru prima dată, inteligența artificială a învins un jucător profesionist pe o tablă 19x19 fără handicap [24] [25] . Unii experți au indicat un decalaj puternic în nivelul de joc între Fan Hui și Li Sedol, proprietarul celui mai înalt rang - al 9-lea dan profesionist și multe titluri câștigate [26] . Anterior, programele de calculator Zen și Crazy Stone au putut să învingă jucătorii profesioniști cu un avans de patru sau cinci pietre [27] [28] . Cercetatorul canadian în teoria jocurilor și inteligența artificială Jonathan Schaeffer, după victoria lui AlphaGo asupra lui Fan Hui, a comparat programul cu un „copil minune” căruia îi lipsește experiența și a afirmat că realizările reale vor începe atunci când programul va juca cu un adevărat jucător de top; Li Sedol a prezis victoria în meci [25] Lee Hajin , un jucător profesionist și secretar general al Federației Internaționale Go , a spus că AlphaGo și Lee Sedol au șanse egale de a câștiga meciul viitor [25] .
După înfrângerea sa, Fan Hui a declarat că datorită acestui meci, a început să joace mai bine și a început să vadă în joc lucruri pe care nu le observase înainte; până în martie 2016, clasamentul global al lui Fan Hui a crescut cu aproximativ 300 de poziții [29]
Experții Go au găsit mai multe greșeli făcute de AlphaGo în jocurile împotriva lui Fan Hui, în special, în evaluarea poziției pe întreaga tablă, spre deosebire de momentele tactice individuale; cu toate acestea, până la începutul meciului împotriva lui Lee Sedol, nu se știa cât de mult s-a îmbunătățit programul de atunci [26] [30] . AlphaGo nu a fost reglat special pentru stilul de joc al lui Lee Sedol, ceea ce oricum ar fi fost dificil de realizat, deoarece „antrenamentul” AlphaGo presupunea vizionarea a zeci de milioane de jocuri; câteva sute sau mii de meciuri ale lui Lee Sedol nu au fost suficiente pentru a schimba stilul de joc al programului. În schimb, AlphaGo s-a uitat la jocurile jucătorilor amatori puternici jucate pe serverele de internet și apoi a jucat împotriva lui însuși; nu existau jocuri Lee Sedol în baza de date de antrenament AlphaGo [31] [32] .
Într-un interviu dinaintea meciului, Lee Sedol a prezis că va câștiga ușor cu scorul de 4-1 sau chiar 5-0, apoi Google va rafina AlphaGo timp de 2-3 ani, după care ar vrea să se răzbune pe el. În acest caz, va fi foarte interesant să te joci cu o versiune actualizată a AlphaGo, credea Lee [33] [34] .
Lee Sedol, un jucător profesionist de 9 dan go [35] , este considerat unul dintre cei mai puternici jucători din istoria go [36] . Cariera sa a început în 1996 când a fost promovat la 1. Dan la vârsta de 12 ani, iar de atunci a câștigat numeroase titluri Go [37] . Stilul lui Lee Sedol este caracterizat de mișcări creative neortodoxe [38] . Previzându -și victoria necondiționată [38] , Lee Sedol, cu câteva săptămâni înainte de meci, a devenit proprietarul unuia dintre principalele titluri go coreene - Myeongin [39] .
AlphaGo este un program de calculator creat de Google DeepMind . Algoritmul AlphaGo folosește o combinație a celor mai recente progrese pentru a găsi strategia optimă în arborele jocului cu cele mai recente tehnici de învățare automată combinate cu învățarea intensivă a jocurilor oamenilor și antrenamentul în timp ce se joacă cu sine [16] . Inițial, AlphaGo a fost antrenat să imite jocul uman, studiind multe jocuri jucate atât de profesioniști, cât și de amatori puternici, inclusiv baza de date a serverului KGS de aproximativ 30 de milioane de mișcări din 160 de mii de jocuri de jucători de la 6 la 9 dan [16] [40 ] ] . După ce a atins un anumit nivel în strategie și tactică, programul a trecut la jocul împotriva lui însuși și învățarea prin întărire [41] . Sistemul nu folosește o bază de date de mișcări. După cum a explicat unul dintre creatorii programului, [23] ,
Deși am programat această mașină, nu știm ce mișcare va face. Mișcările ei sunt un fenomen de emergență care este rezultatul antrenamentului. Creăm doar serii de date și algoritmi de învățare. Dar mișcările la care recurge nu sunt în mâinile noastre și mult mai bune decât am putea alege noi, ca jucători.
Versiunea programului folosită în meciul împotriva lui Li Sedol a folosit aceeași putere de calcul ca și în jocurile împotriva lui Fan Hui - 1920 CPU și 280 GPU [1] . În mai 2016, Google a anunțat că AlphaGo folosește TPU , un procesor dezvoltat de Google special pentru învățarea automată, [42] [43] în curs de formare .
Cinci meciuri ale meciului au avut loc pe 9, 10, 12, 13 și 15 martie 2016 la Seul [44] .
Jocurile s- au jucat conform regulilor chinezești , komi -ul a fost de 7,5 puncte; controlul timpului - 2 ore de timp regulat pentru fiecare jucător 3 perioade byoyomi de 60 de secunde [9] . Jocurile s-au desfășurat într-o sală închisă în prezența a trei observatori oficiali, printre care și Fan Hui. În timpul jocurilor, nu au fost înregistrate incidente care au dus la intervenția observatorilor.
Meciurile au fost transmise în direct pe YouTube , împreună cu comentariile live ale jocului în engleză de la Michael Redmond [45] (singurul jucător non-asiatic cu 9 dan profesionist [46] ) și în coreeană de la Yoo Changhyuk , Song Taegon și alții Profesionişti coreeni [47] [48] [49] . Aya Huan (jucător amator 6-dan și membru al echipei de dezvoltare DeepMind) a pus pietrele goban pentru AlphaGo [6] . Activitatea programului a fost realizată folosind Google Cloud Platform , serverul a fost localizat în SUA [50] .
Dezvoltatorii au decis să folosească o versiune „fixă” a programului înainte de fiecare joc, așa că nu a folosit jocurile jucate în acest meci pentru auto-învățare și nu s-a adaptat stilului de joc al lui Lee Sedol, redefinindu-și de fiecare dată strategia [51] .
Câștigătorul meciului a primit 1 milion de dolari drept recompensă. Reprezentanții Google DeepMind au spus că, dacă AlphaGo câștigă, intenționează să doneze acești bani unor fundații caritabile (inclusiv UNICEF ) și organizații implicate în dezvoltarea Go [8] . Lee Sedol a primit 150.000 USD pentru participarea la meci și 20.000 USD pentru victoriile în seturi individuale [8] [9] .
Jocul # | negru | alb | Rezultat | data | mișcări | Timp petrecut [aprox. unu] |
---|---|---|---|---|---|---|
unu | Lee Sedol | Alpha Go | 0-1 (predat) | 9 martie 2016 | 186 | Lee Sedol: 1 oră 32 min. - AlphaGo: 1h. 55 min |
2 | Alpha Go | Lee Sedol | 1-0 (predat) | 10 martie 2016 | 211 | Lee Sedol: 2 ore - AlphaGo: 2h. |
3 | Lee Sedol | Alpha Go | 0-1 (predat) | 12 martie 2016 | 176 | Lee Sedol: 2 ore - AlphaGo: 1h. 51 min. |
patru | Alpha Go | Lee Sedol | 0-1 (predat) | 13 martie 2016 | 180 | Lee Sedol: 2 ore - AlphaGo: 1h. 59 min. |
5 [aprox. 2] [52] [53] | Lee Sedol | Alpha Go | 0-1 (predat) | 15 martie 2016 | 280 | Lee Sedol: 2 ore - AlphaGo: 2h. |
Scor general: AlphaGo - Lee Sedol: 4-1 |
Comentând primul joc al meciului, atât Cho Hansung (al 9-lea dan profesionist), cât și Michael Redmond au remarcat că AlphaGo s-a îmbunătățit semnificativ în comparație cu meciul din octombrie împotriva lui Fan Hui [54] . Deja în stadiul fuseki , a devenit clar că programul se juca la nivelul celor mai buni jucători umani; Nie Weiping (Pro al 9-lea dan, China) a sugerat că AlphaGo joacă în puterea celui de-al 6-lea sau al 7-lea dan în fuseki și al 13-lea-15-lea dan în tuban [55] . Însuși Lee Sedol, după ce a pierdut al doilea joc, a spus: „Ieri am fost surprins, dar astăzi nu am cuvinte” [56] . După a treia înfrângere a lui Lee Sedol, AlphaGo a câștigat meciul înainte de termen, iar comentatorii au fost de acord că mai există speranță pentru o victorie umană [57] . Ke Jie , care la acea vreme a condus clasamentul jucătorilor și a provocat și AlphaGo, a declarat că a început să se îndoiască de victoria sa asupra programului [58] . Au fost observate erori în jocuri din partea programului; Demis Hassabis a declarat că vor fi analizați cu atenție și că AlphaGo se pare că „nu cunoaște unele dintre tesuji clasice și face greșeli tactice”, ceea ce a devenit clar după ce jocul a pierdut în fața lui, când programul, după mutarea cheie câștigătoare a lui Lee Sedol, a început să facă mișcări ilogice în loc să se predea [59] . După meci, Lee Sedol a declarat că a fost învins psihic, dar deloc tehnic [60] . Programul a arătat o capacitate de soluții creative, care a surprins mulți jucători (de exemplu, mutarea numărul 37 în al doilea joc); unele mișcări au contrazis teoria clasică a lui Go, dar și-au dovedit eficiența în meci, unii profesioniști au început să folosească aceste constatări în jocurile lor [23] . Cho Hye-young (al 9-lea dan profesionist) a declarat că și-ar dori să învețe jocul de la AlphaGo deoarece „știe totul” [61] . Lee Sedol însuși a decis să schimbe unele aspecte ale jocului său după meci [60] . Comentatorii din timpul meciului au fost de acord că AlphaGo face greșeli și au fost siguri că în cele din urmă va rămâne fără teritoriu pentru a câștiga [23] , dar în final, mișcările care păreau inițial slabe au dus la o victorie [57] .
Momente cheie ale petrecerilorÎn timpul jocurilor, observatorii au remarcat patru mișcări excepționale care au influențat rezultatul jocurilor; Lee Sedol le-a comentat într-o serie de articole în Dong-a Ilbo [62] :
Jocul 1 : Mișcarea care l-a lovit pe Lee Sedol. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Invazie, mutare 102 [63] . |
Al doilea joc : O mișcare creativă neașteptată a programului [64] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mutarea 37, o „lovitură de umăr” respinsă de teoria jocurilor clasice. |
Al treilea joc : Contraatac impresionant [57] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mutarea 32 desfășoară atacul în joc. |
Jocul 4 : Mișcarea divină a lui Lee Sedol . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
După ce a jucat tesuji (a 78-a mutare) , scorul AlphaGo s-a schimbat dramatic [65] . |
În primul joc, care a avut loc pe 9 martie, AlphaGo (Alb) a câștigat. Lee Sedol a ținut jocul sub control de cele mai multe ori, programul a profitat în ultimele 20 de minute, forțându-l pe Lee să se supună [63] . După joc, Lee a declarat că a făcut o greșeală critică la începutul jocului și că strategia programului la etapa inițială a jocului a fost „mare”, iar inteligența artificială a făcut o mișcare neobișnuită pe care o persoană ar fi făcut-o. nu juca niciodată [63] . Revizorul site-ului Go Game Guru , David Omerod, a remarcat că a șaptea mișcare a lui Lee Sedol a fost „o mișcare ciudată făcută pentru a testa puterea AlphaGo în fuseki ” și că mișcarea de întoarcere a programului a fost „precizată și eficientă”; în estimarea lui, prima parte a jocului a fost lăsată la AlphaGo, iar Lee a început să recâștige avantajul cu mutarea 81, apoi a făcut mutările „dubioase” 119 și 123, urmate de 129, care a dus la înfrângere [54] . Cho Hansung , care a comentat jocul, a remarcat progresul puternic al AlphaGo în comparație cu meciul împotriva lui Fan Hui din octombrie 2015 [54] . Michael Redmond a remarcat că stilul programului a devenit mai agresiv în comparație cu jocurile împotriva lui Fan Hui [66] .
În opinia lui Kim Sungryong (al 9-lea dan profesionist), Lee Sedol a fost șocat de mutarea 102 [67] , după care s-a gândit la mutarea de retur mai bine de 10 minute [67] . Lee Sedol a recunoscut înfrângerea la mutarea 186, după aproximativ trei ore și jumătate de joc, deși mai avea 28 de minute și 28 de secunde pe ceas [67] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 100-186 |
În al doilea joc, care a avut loc pe 10 martie, AlphaGo a câștigat cu negru. După joc, Lee Sedol a declarat că „AlphaGo a arătat un joc aproape perfect” [68] și că „încă de la începutul jocului, nu a simțit nici măcar un moment în care să fie în frunte” [69] . Unul dintre creatorii programului, Demis Hassabis, a declarat că sistemul era sigur de victorie încă de la jumătatea jocului, când nici măcar profesioniștii care comentau jocul nu au putut stabili cine era înainte [69] .
Michael Redmond a remarcat că cursul 37 al programului a fost „creativ” și „unic” [23] . Lee Sedol i-a luat o perioadă de timp neobișnuit de lungă pentru a răspunde [23] . Ahn Yong-gil (al 8-lea dan profesionist) a descris mișcarea nr. 37 drept „o lovitură rară și intrigantă de umăr”, dar a remarcat că mișcarea de întoarcere a lui Lee a fost „exquisită”. El a afirmat că controlul jocului a trecut de la un jucător la altul de mai multe ori și, în special, a notat mișcările programului nr. 151, 157 și 159, numindu-le „strălucitoare” [64] .
AlphaGo s-a abătut de la înțelepciunea convențională în acest joc și a arătat o abordare mai largă, pe care profesioniștii lui Go au descris-o ca fiind greșeli aparente la prima vedere, de fapt, executând o strategie de anvergură [70] . Creatorii programului au explicat că AlphaGo nu încearcă să maximizeze numărul de puncte sau cantitatea de câștiguri, ci probabilitatea de a câștiga [23] [61] : Dacă AlphaGo trebuie să aleagă între câștigarea a 20 de puncte cu 80% probabilitate sau câștig 1 punct cu 99% probabilitate, va alege pe acesta din urmă, chiar dacă înseamnă pierderea de puncte [23] . De exemplu, se pare că mișcarea 167, care îi oferă lui Lee Sedol o șansă de luptă, a fost privită de comentatori ca o greșeală evidentă; Ahn Yong-gil a declarat că „când AlphaGo face o mișcare care pare slabă, o putem considera o greșeală, dar poate că ar fi mai corect să considerăm o astfel de mișcare ca o declarație de victorie?” [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 100-199 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
mutările 200-211 |
În al treilea joc, desfășurat pe 12 martie, AlphaGo a câștigat și a câștigat întregul meci înainte de termen [71] .
După al doilea joc, jucătorii profesioniști și-au exprimat în continuare îndoielile cu privire la faptul că AlphaGo este un jucător la fel de puternic pe cât poate fi o persoană. După cel de-al treilea joc, conform analiștilor, aceste îndoieli au fost risipite, s-a remarcat priceperea programului în lupte - cu atacul aparent sever al lui Lee Sedol, nu a primit avantaje din acest atac [57] .
Ahn Yong-gil și David Omerod au declarat că AlphaGo este „mai puternic decât orice jucător uman cunoscut de noi” [57] . S-a dovedit că AlphaGo este capabil să controleze situația atunci când se desfășoară ko-fighting , ceea ce a fost considerat anterior o slăbiciune semnificativă a majorității programelor care jucau Go, în ultimele două jocuri nu a existat o ko-fighting importantă pe tablă [72] . Ei au remarcat, de asemenea, cea de-a 148-a mutare a programului - în mijlocul unei lupte ko dificile, AlphaGo, având „încredere” în câștigarea luptei, a făcut o mișcare mare în altă parte a tablei [57] .
Li, jucând negru, a ales High Chinese Fuseki și a creat o sferă de influență pe care AlphaGo a invadat-o la mișcarea 12, după care programul a putut să-și apere grupul invadator slab [57] . Potrivit lui An Yong-gil, cele 31 de mișcări ale lui Lee ar fi putut fi motivul înfrângerii sale [57] , Andy Jackson ( American Go Association ) a decis că rezultatul jocului a fost deja decis la mutarea 35 [61] . Prin mutarea 48, AlphaGo a preluat controlul jocului și l-a forțat pe Lee Sedol să facă mișcări defensive. Contraatacul lui Lee asupra mutărilor 77-79 nu a adus succes, prin mutarea 90 programul a simplificat poziția pe tablă, după care a dobândit o cantitate mare de teritoriu pe partea de jos [57] . Lee a încercat din nou să lanseze un atac, dar mișcările programului au fost inconfundabile. La mișcarea 131, a încercat să organizeze o luptă ko, provocând programul să facă o greșeală. La mișcarea 176, Lee Sedol și-a dat demisia [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cursuri 100-176 (122 in 113, 154 in , 163 in 145, 164 in 151, 166 si 171 in 160, 169 in 145, 175 in ) |
Al patrulea joc, desfășurat pe 13 martie, s-a încheiat cu victoria lui Lee Sedol. Potrivit lui Demis Hassabis, programul a făcut o greșeală la mișcarea 79, când, conform propriilor estimări, probabilitatea victoriei sale era de 70%; la a 87-a mutare, această valoare a scăzut brusc [73] [74] . David Omerod a descris mișcările programului de la 87 la 101 ca erori tipice pentru un program bazat pe metoda Monte Carlo [65] - motorul de căutare încearcă să taie unele secvențe care nu au legătură cu o anumită situație; în unele cazuri, acest lucru poate duce la faptul că programul întrerupe mișcările corecte și nu le mai poate lua în considerare în viitor [65] .
În acest joc, Lee Sedol a ales strategia amasi (stil orientat pe teritoriu, permițând inamicului să ocupe puncte cheie de influență, dar în același timp jucătorul însuși primește teritoriu garantat, după care poate încerca să spargă influența inamicului) , hotărând să câștige teritoriu pe laterale, nu în centru, spre deosebire de strategia AlphaGo de a câștiga cu multe mici achiziții [65] [75] . Optând pentru o astfel de strategie, Lee Sedol a sperat să-l conducă pe adversar într-o situație all-in, care ar putea fi un punct slab probabil într-un program a cărui putere este evaluarea schimbului; într-o astfel de situație, capacitatea AlphaGo de a identifica cele mai mici avantaje nu ar avea un impact puternic asupra probabilității de câștig [65] .
Primele 11 mutări au fost identice cu începutul celui de-al doilea joc, unde Lee a jucat și el alb. În etapa fuseki, Lee s-a concentrat pe câștigarea teritoriului în colțurile și părțile laterale ale plăcii, permițând lui AlphaGo să creeze influență pe partea de sus și în centru. După aceea, Lee a invadat zona de influență a AlphaGo (mutările 40-48), urmând principiile amasi . AlphaGo a sacrificat patru pietre și a luat inițiativa (mutările 47-69). Ca răspuns la mișcările lui Lee Sedol de la 72 la 76, programul nu a făcut greșeli, iar comentatorii au început să declare că jocul se va dovedi din nou a fi înfrângerea lui Lee, totuși, mutarea 78 (care a fost tesuji în această situație) și combinația care a urmat până la mutarea 82 a transformat complet rezultatul jocului [65] . Mutarea, care a permis împărțirea adversarului în centru, a complicat jocul [76] . Mișcările 83 și 85 ale lui AlphaGo au fost acceptabile, dar apoi de la mișcările 87 la 101 programul a făcut o serie de mișcări slabe, sincer proaste. La mutarea 92, Lee Sedol a preluat conducerea jocului, iar mutarea 105 a fost descrisă de Ahn Yong-gil drept mutarea finală care a dus la înfrângerea programului; AlphaGo nu a putut să recâștige punctele pierdute și a demisionat după mutarea 180 [65] . AlphaGo a estimat că probabilitatea ei de a câștiga era mai mică de 20% [76] .
Gu Li (al 9-lea dan profesionist, China) a numit cea de-a 78-a mișcare a lui Li Sedol o „mișcare divină” (în terminologia jocului Go - o mișcare specială, numai adevărată și strălucitoare, care se întâmplă „o dată în viață”, cel mai adesea într-un moment critic al jocului) și a remarcat că nu am văzut absolut această mișcare [65] . Ahn Yong-gil a declarat că jocul a fost „capodopera lui Lee Sedol și aproape sigur va deveni celebru în istoria lui Go” [65] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcări 100-180 (177 in , 178 in ) |
Potrivit termenilor meciului, cine joacă negru în ultimul joc urma să fie decis prin tragere la sorți. Cu toate acestea, la o conferință de presă după cel de-al patrulea joc, Lee Sedol a declarat că crede că AlphaGo este mai puternic când a jucat cu alb, așa că și-ar dori să joace negru în jocul final, mai ales că a câștigat deja cu alb. Reprezentanții AlphaGo au fost de acord, așa că nu a existat nicio remiză [52] [53] .
În ultimul joc jucat pe 15 martie, câștigătorul a fost AlphaGo (alb) [77] . Până la final, o luptă egală a avut loc în acest joc. Demis Hassabis a afirmat că la început programul a făcut o greșeală gravă, ceea ce a dus la o luptă atât de egală [77] .
Jucând negru, Lee Sedol a ales un fuseki asemănător cu cel pe care l-a jucat în primul joc al meciului, după care a trecut la o strategie teritorială care a dus la victoria în jocul precedent. Rezultatul a părut chiar până la mișcările 48 la 58, unde AlphaGo, jucând mișcări forțate inutile, a pierdut ko-amenințări și aji , permițându-i lui Lee Sedol să preia conducerea [78] . Michael Redmond a sugerat că cel mai probabil programul nu a văzut celebrii jucători cu experiență tesuji - cel mai adesea cunosc o astfel de combinație de mișcări, dar programul ar trebui să o calculeze de la bun început [77] .
Până la a 90-a mutare, după ce a răspuns în mod inconfundabil mișcărilor de atac ale lui Lee Sedol, programul a restabilit echilibrul în joc, după care a făcut o serie de mișcări pe care David Omerod le-a numit „neobișnuite... dar cu viclenie impresionantă” și le-a permis să captureze un mic avantaj [78] . Lee a încercat să recâștige punctele, dar programul a răspuns fără greșeală. Ahn Yong-gil a evidențiat mișcările 154, 186 și 194. În etapa yose , AlphaGo a jucat, de asemenea, impecabil, păstrând conducerea pe teritoriu, ceea ce l-a forțat pe Lee Sedol să demisioneze la mutarea 280 [78] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcările 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mișcări 100-199 (118 în 107, 161 în ) |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cursuri 200-280 (240 in 200, 271 in , 275 in , 276 in ) |
Transmisiunile live ale jocurilor meciului și analiza acestora au fost efectuate în coreeană , chineză , japoneză , engleză și rusă . Emisiunea a fost în coreeană la Baduk TV [79] . Prima tranșă a fost comentată în chineză de Gu Li și Ke Jie pentru Tencent și , respectiv, LeEco , cu 60 de milioane de telespectatori [29] . Meciul a fost difuzat online în engleză de Michael Redmond și Chris Garlock, vicepreședinte al Asociației American Go ; numărul mediu de spectatori a fost de aproximativ 80 de mii de oameni; cel mai mare număr de spectatori s-a înregistrat la finalul primei tranșe și s-a ridicat la 100 de mii [80] . Analiza jocurilor de pe YouTube a fost condusă de Cho Hye -young (al 9-lea dan) și Kim Myeongwan (al 9-lea dan) [61] . În Rusia, transmisiunile în direct ale jocurilor meciului cu analiză au fost efectuate de 3 dan profesionist Alexander Dinershtein (1 joc) [81] [82] , Ilya Shikshin (1 dan profesionist) și multiplă campioană europeană în rândul femeilor Natalia Kovaleva (2-). 5 jocuri) [83] .
Victoria AlphaGo a fost un eveniment semnificativ în domeniul cercetării inteligenței artificiale [84] . Anterior, predarea unui computer să joace Go era considerată dincolo de atingerea tehnologiilor existente și de nivelul de dezvoltare a acestora [84] [85] [86] . Majoritatea experților au fost înclinați să creadă că va dura aproximativ 5 ani până să apară programul AlphaGo power level [87] , unii experți credeau că va dura chiar și 10 ani până când computerul va putea învinge campionii Go [88] [89] . La începutul anului 2016, majoritatea previziunilor indicau victoria lui Lee Sedol [84] .
Când computerul a început să-i învingă pe cei mai puternici jucători umani în dame , șah și acum mergeți, realizările programelor de calculator în domeniul jocurilor de masă populare nu mai sunt considerate o realizare atât de semnificativă și un punct de cotitură în istoria dezvoltării inteligență artificială comparativ cu anii anteriori; Dezvoltatorul Deep Blue Murray Campbell a numit victoria lui AlphaGo „sfârșitul unei ere... jocurile de societate sunt aproape gata și este timpul să trecem mai departe” [84] . Dezvoltatorii DeepMind au declarat că iau în considerare găzduirea unui meci StarCraft II între software-ul lor și Tim Morten, un campion StarCraft II [90] [91] . Jocurile de societate cu informații incomplete ( poker , bridge ) pot deveni și ele obiect de cercetare a posibilităților programelor de calculator [92] [93] .
În comparație cu Deep Blue sau Watson , algoritmii AlphaGo sunt proiectați pentru sarcini mai largi, ceea ce poate indica faptul că s-au înregistrat progrese și în domeniul dezvoltării generale a inteligenței artificiale [94] ; victoria AlphaGo ar putea fi impulsul pentru dezvoltarea de programe cu obiective mai largi. În martie 2016, cercetătorul britanic Sewart J. Russell a declarat că „tehnicile de inteligență artificială avansează mult mai repede decât se aștepta, ceea ce face ca problema rezultatelor pe termen lung să fie mai relevantă”, adăugând că „a se asigura că sistemele AI din ce în ce mai puternice rămân ar fi în subordinea controlul complet al omului... e multă muncă de făcut” [95] . Fizicianul Stephen Hawking a avertizat că viitoarele sisteme AI auto-evolutive ar putea duce la capturarea neașteptată a oamenilor de mașini [96] , unii oameni de știință, în special Jean-Gabriel Ganasia, afirmând că „lucruri precum „bunul simț”… nu creează niciodată” respinge un astfel de scenariu [97] ; Ganasia nu vede niciun motiv să „vorbească despre temeri. Dimpotrivă, dă speranță în multe domenii, de exemplu, în îngrijirea sănătății și explorarea spațiului” [95] . Richard Sutton spune că „oamenii nu ar trebui să se teamă... dar trebuie să-i acorde atenție” [98] .
Înainte de publicarea articolului în revista Nature în ianuarie 2016, mai multe organizații cercetau deja rețele neuronale pentru a crea programe care joacă Go, în special, Facebook dezvolta programul Darkforest , ulterior codul programului a fost pus la dispoziția publicului [99] [100] . După meci a început dezvoltarea programelor concurente AphaGo, printre care se remarcă Deep Zen Go și Fine Art.
Programul Deep Zen Go a fost dezvoltat anterior sub numele Zen, dar după succesul AlphaGo dezvoltatorul a adăugat un element de învățare profundă Zen . În noiembrie 2016, a avut loc un meci între Deep Zen Go și cel mai titrat jucător al Japoniei, Cho Chikun [101] [102] . Meciul s-a încheiat cu victoria bărbatului cu scorul de 2: 1 [103] . În martie 2017, a avut loc „Turneul celor Patru”, unde cei mai puternici jucători din Japonia, China și Coreea ( Yuta Iyama , Mi Yutin și Park Jong-hwan ) și Deep Zen Go s-au luptat [104] , conform rezultatelor meciului, computerul a câștigat un joc din trei (împotriva lui Yuta Iyama) [105] [106] .
Programul Fine Art a fost dezvoltat de compania chineză Tencent . În martie 2017, ea a câștigat Campionatul Software Go, care, însă, nu a prezentat AlphaGo; Deep Zen Go a ocupat locul doi. Anterior, în ianuarie 2017, Fine Art a reușit să-l învingă de mai multe ori pe cel mai puternic jucător uman de Go, Ke Jie , care mai târziu a jucat și cu AlphaGo , pierzând și considerând că alte jocuri cu inteligență artificială sunt inutile [107] .
Jocul Go, considerat anterior un joc pur asiatic, nu atât de comun în țările occidentale, a câștigat o mare popularitate în diverse țări ale lumii datorită faptului că milioane de oameni au urmărit și discutat meciul [84] . Potrivit lui Demis Hassabis, 280 de milioane de oameni au urmărit meciul, au fost publicate 35.000 de articole despre acesta în presă, iar vânzările de plăci go au crescut de zece ori [108] .
Mulți dintre jucătorii de top au remarcat că mișcările făcute de program nu sunt standard; unele mișcări păreau inițial îndoielnice, dar pe parcursul jocului și-au arătat eficacitatea [88] . În timp ce jucătorii încearcă să învețe și să adopte cele mai bune mișcări din alte jocuri, AlphaGo își face propriile mișcări originale [84] . AlphaGo s-a îmbunătățit semnificativ în comparație cu meciul împotriva lui Fan Hui, cu toate acestea, după înfrângerea sa, Li Sedol a declarat că jocul programului încă nu este perfect [109] [110]
Jucătoarea chineză Ke Jie , care a condus clasamentul mondial, a declarat înainte de meci că este capabil să o învingă pe AlphaGo, dar nu a vrut să se joace cu ea, deoarece programul avea să înceapă să „i copie stilul” [111] . După primele trei jocuri ale meciului, Ke Jie a recunoscut deja că „ar putea pierde” [112] , dar după cel de-al patrulea joc a început din nou să vorbească cu încredere despre victoria sa, argumentând că dacă performanța programului în cel de-al patrulea joc al meciul este „adevărata lui putere, atunci nu merită să se joace cu el” [113] .
Arbitrul meciului împotriva lui Fan Hui, Toby Manning, și secretarul general al Federației Internaționale de Go, Li Hajin , au declarat că, în viitor, jucătorii vor putea învăța de la computer, vor putea afla unde au făcut greșeli în joc și să-și îmbunătățească abilitățile de joc [110] .
După meci, Lee Sedol și-a cerut scuze pentru pierderea sa și a declarat că „a subestimat abilitățile AlphaGo și s-a simțit neputincios” [84] . El a subliniat că rezultatul meciului a fost „înfrângerea lui Lee Sedol” și nu „înfrângerea umanității.” [96] [114] . Lee a recunoscut că pierderea sa era inevitabilă, dar că „roboții nu vor înțelege niciodată frumusețea jocului așa cum o fac oamenii” [96] . Lee a numit rezultatul din cea de-a patra tranșă „o victorie neprețuită pe care nu o va schimba pentru nimic” [114] . Lee Sedol a declarat că a învățat multe din jocul cu AlphaGo și stilul său a devenit mai flexibil; și-a dat seama cât de slabă poate fi intuiția umană, iar abilitatea lui de a prezice următoarele mișcări ale adversarului a fost mult îmbunătățită [115] .
Asociația coreeană Paduk a acordat AlphaGo un rang onorific de al 9-lea dan profesionist pentru „eforturile sincere de a stăpâni fundamentele taoiste ale go și de a atinge un nivel de joc apropiat de divin” [10] .
După încheierea meciului, pe 17 martie 2016, reprezentanții guvernului Republicii Coreea au anunțat că vor investi 863 de milioane de dolari (1 trilion de won coreean) în cercetarea inteligenței artificiale în următorii cinci ani [116]
Mulți jucători și-au exprimat dorința de a deveni următorul adversar al AlphaGo [117] , cu toate acestea, printre cei mai probabili candidați a fost Ke Jie , care a pretins că a câștigat programul [118] . Meciul cu Ke Jie a avut loc în perioada 23 mai - 27 mai 2017, AlphaGo a câștigat toate cele trei jocuri [119] [120] [121] .
Merge | |||||
---|---|---|---|---|---|
| |||||
Inventar | |||||
Reguli |
| ||||
Etapele jocului | |||||
Terminologie | |||||
Descărcări | |||||
Organizații | |||||
Titluri | |||||
Turnee internaționale |
| ||||
Intră în artă |
| ||||
Alte | |||||
|