Testul Turing este un test empiric, a cărui idee a fost propusă de Alan Turing în articolul „Computing Machines and the Mind” , publicat în 1950 în revista filozofică Mind . Turing și-a propus să determine dacă o mașină ar putea gândi .
Interpretarea standard a acestui test este următoarea: „ O persoană interacționează cu un computer și o persoană. Pe baza răspunsurilor la întrebări, el trebuie să stabilească cu cine vorbește: cu o persoană sau cu un program de calculator. Sarcina unui program de calculator este să inducă în eroare o persoană să facă o alegere greșită .”
Toți participanții la test nu se văd. Dacă judecătorul nu poate spune cu siguranță care dintre interlocutori este uman, atunci mașina se consideră că a trecut testul. Pentru a testa inteligența mașinii și nu capacitatea acesteia de a recunoaște vorbirea orală, conversația se desfășoară în modul „numai text”, de exemplu, folosind tastatura și ecranul (calculatorul intermediar). Corespondența trebuie să aibă loc la intervale controlate, astfel încât judecătorul să nu poată trage concluzii pe baza rapidității răspunsurilor. Pe vremea lui Turing, computerele reacționau mai lent decât oamenii. Acum este necesară și această regulă, deoarece reacţionează mult mai repede decât o persoană.
Deși cercetarea inteligenței artificiale a început în 1956 , rădăcinile sale filozofice se întorc adânc în trecut . Întrebarea dacă o mașină poate gândi are o istorie lungă. Este strâns legat de diferențele dintre viziunile dualiste și cele materialiste . Din punctul de vedere al dualismului, gândirea nu este materială (sau cel puțin nu are proprietăți materiale), și de aceea mintea nu poate fi explicată doar cu ajutorul conceptelor fizice. Pe de altă parte, materialismul susține că mintea poate fi explicată fizic, lăsând astfel posibilitatea existenței unor minți create artificial.
În 1936, filozoful Alfred Ayer a adresat o întrebare filozofică comună despre alte minți: de unde știm că alți oameni au aceeași experiență conștientă ca și noi? În cartea sa Language, Truth and Logic, Ayer a propus un algoritm pentru recunoașterea unei persoane conștiente și a unei mașini inconștiente: „Singura bază pe care pot spune că un obiect care pare a fi inteligent nu este cu adevărat o ființă rațională, ci doar o mașină proastă, este că nu poate trece unul dintre testele empirice prin care este determinată prezența sau absența conștiinței. Această afirmație este foarte asemănătoare cu testul Turing, dar nu se știe sigur dacă popularul clasic filozofic al lui Ayer era cunoscut lui Turing.
În ciuda faptului că au trecut mai bine de 50 de ani, testul Turing nu și-a pierdut semnificația. Dar în prezent, cercetătorii în inteligența artificială practic nu rezolvă problema trecerii testului Turing, considerând că este mult mai important să studiem principiile fundamentale ale inteligenței decât să dublezi unul dintre purtătorii inteligenței naturale. În special, problema „zborului artificial” a fost rezolvată cu succes abia după ce frații Wright și alți cercetători au încetat să imite păsările și au început să studieze aerodinamica. În lucrările științifice și tehnice despre aeronautică, scopul acestui domeniu de cunoaștere nu este definit ca „crearea unor mașini care, în zborul lor, amintesc atât de porumbei, încât pot chiar înșela păsările adevărate”. [unu]
Până în 1956, oamenii de știință britanici cercetau „inteligența mașinilor” timp de 10 ani. Această întrebare a fost un subiect obișnuit de discuție între membrii Ratio Club, un grup informal de ciberneticieni britanici și cercetători în electronică, care a inclus Alan Turing, după care a fost numit testul.
Turing a fost preocupat în special de problema inteligenței mașinilor încă din 1941. Una dintre primele sale referiri la „inteligență informatică” a fost în 1947. În raportul său Intelligent Machines, Turing a explorat întrebarea dacă o mașină ar putea detecta un comportament inteligent și, ca parte a acestui studiu, a propus ceea ce ar putea fi considerat un precursor al cercetărilor sale viitoare: „Nu este dificil să dezvolti o mașină care să joace șah. bine. Acum să luăm trei persoane - subiecții experimentului. A, B și C. Fie A și C să joace șah fără importanță, iar B să fie operatorul mașinii. […] Sunt folosite două camere, precum și un mecanism de transmitere a mesajelor despre mișcări. Participantul C joacă fie A, fie o mașină. Participantului C poate fi dificil să spună cu cine se joacă.
Astfel, până la data publicării în 1950 a articolului „Computing Machines and the Mind”, Turing luase în considerare de mulți ani posibilitatea existenței inteligenței artificiale. Cu toate acestea, acest articol a fost primul articol al lui Turing care s-a ocupat exclusiv de acest concept.
Turing își începe articolul declarând: „Îmi propun să luăm în considerare întrebarea „Pot mașinile să gândească?”. El subliniază că abordarea tradițională a acestei probleme este de a defini mai întâi conceptele de „mașină” și „inteligență”. Turing a luat însă o altă cale; în schimb, a înlocuit întrebarea inițială cu o alta „care este strâns legată de original și este relativ lipsită de ambiguitate”. În esență, el propune să înlocuiască întrebarea „Mașinile gândesc?” întrebarea „Pot mașinile să facă ceea ce noi (ca creaturi gânditoare) putem face?”. Avantajul noii întrebări, susține Turing, este că ea trasează „o linie clară între capacitățile fizice și intelectuale ale unei persoane”.
Pentru a demonstra această abordare, Turing oferă un test conceput prin analogie cu jocul de petrecere „Joc de imitație” – un joc de imitație. În acest joc, un bărbat și o femeie merg în camere diferite, iar oaspeții încearcă să-i deosebească punându-le o serie de întrebări scrise și citindu-le răspunsurile dactilografiate. Conform regulilor jocului, atât bărbatul, cât și femeia încearcă să-i convingă pe oaspeți că este opusul. Turing propune să refacă jocul după cum urmează: „Acum să ne punem întrebarea, ce se va întâmpla dacă în acest joc rolul A este jucat de o mașină? Va greși cel care a întrebat la fel de des ca și cum s-ar juca cu un bărbat și o femeie? Aceste întrebări înlocuiesc originalul „Poate o mașină să gândească?”.
În același raport, Turing propune mai târziu o formulare alternativă „echivalentă” care implică un judecător care vorbește doar cu un computer și cu un om. Deși niciuna dintre aceste formulări nu se potrivește exact cu versiunea testului Turing care este cel mai bine cunoscut astăzi, omul de știință a propus o a treia în 1952. În această versiune a testului, despre care Turing a discutat la radioul BBC, juriul pune la îndoială un computer, iar rolul computerului este de a face o parte semnificativă a juriului să creadă că este de fapt uman.
Lucrarea lui Turing abordează 9 întrebări propuse, care includ toate obiecțiile majore la adresa inteligenței artificiale ridicate de când lucrarea a fost publicată pentru prima dată.
Blay Whitby subliniază patru puncte de cotitură majore în istoria testului Turing - publicarea lucrării „Computing Machinery and the Mind” în 1950, anunțul creării de către Joseph Weizenbaum a programului Eliza (ELIZA) în 1966, crearea programului PARRY de Kenneth Colby , care a fost descris pentru prima dată în anul 1972, și Colocviul Turing în 1990.
Principiul de funcționare al Elizei este de a examina comentariile introduse de utilizator pentru prezența cuvintelor cheie. Dacă este găsit un cuvânt cheie, atunci se aplică regula, conform căreia comentariul utilizatorului este convertit și propoziția rezultată este returnată. Dacă cuvântul cheie nu este găsit, Elise fie returnează un răspuns general utilizatorului, fie repetă unul dintre comentariile anterioare. În plus, Wizenbaum a programat-o pe Eliza să imite comportamentul unui psihoterapeut centrat pe client. Acest lucru îi permite lui Elise să „pretind că nu știe aproape nimic despre lumea reală”. Folosind aceste metode, programul lui Wizenbaum a fost capabil să inducă în eroare unii oameni să creadă că vorbesc cu o persoană reală, iar pentru unii le-a fost „foarte greu să convingă că Eliza […] nu era umană”. Pe această bază, unii susțin că Eliza este unul dintre programele (poate primul) care ar putea trece testul Turing. Cu toate acestea, această afirmație este foarte discutabilă, deoarece „întrebatorii” au fost instruiți să creadă că vor vorbi cu un psihoterapeut adevărat și să nu fie conștienți că ar putea vorbi cu un computer.
Lucrarea lui Colby, PARRY, a fost descrisă ca „Eliza cu opinii”: programul a încercat să modeleze comportamentul unui schizofrenic paranoic folosind o abordare similară (dacă nu mai avansată) cu cea a Elizei decât a lui Weizenbaum. Pentru a testa programul, PARRY a fost testat la începutul anilor 70 folosind o modificare a testului Turing. O echipă de psihiatri cu experiență a analizat un grup de pacienți reali și computere PARRY folosind teletip. O altă echipă de 33 de psihiatri i s-au arătat ulterior transcrieri ale conversațiilor. Ambele echipe au fost apoi rugate să stabilească care dintre „pacienți” era un om și care era un program de calculator. Psihiatrii doar în 48% din cazuri au reușit să ia decizia corectă. Această cifră este în concordanță cu probabilitatea selecției aleatorii. Aceste experimente nu au fost teste Turing în cel mai adevărat sens, deoarece testul necesită ca întrebările să poată fi adresate interactiv pentru a lua o decizie, în loc să citească o transcriere a conversației trecute.
Aproape toate programele dezvoltate nu s-au apropiat nici măcar de a trece testul. În timp ce programe precum Eliza i-au făcut uneori pe oameni să creadă că vorbesc cu un om, ca într-un experiment informal numit AOLiza , aceste cazuri nu pot fi considerate că trec corect testul Turing din mai multe motive:
Aparatul poate evita întrebările inutile, de exemplu, pretinzând că este paranoic, un adolescent sau un străin cu cunoștințe insuficiente a limbii locale. Câștigătorul uneia dintre cele mai recente concursuri de testare Turing, un bot pe nume Zhenya Gustman , a reușit să combine toate cele trei trucuri, prefăcându-se că este un băiat de treisprezece ani din Odessa [2] .
În 1980, în articolul „Mind, Brain, and Programs”, John Searle a prezentat un argument împotriva testului Turing cunoscut sub numele de experimentul gândirii „ Camera chineză ” . Searle a insistat că programele (cum ar fi Eliza ) au putut trece testul Turing pur și simplu manipulând simboluri ale căror semnificații nu le-au înțeles. Și fără a înțelege, nu pot fi considerați „inteligenti” în același sens ca oamenii. „Astfel”, conchide Searle, „testul Turing nu este dovada că o mașină poate gândi, iar acest lucru contrazice presupunerea inițială a lui Turing”.
Argumente precum cel propus de Searle și altele bazate pe filosofia minții, au dat naștere unor discuții mult mai aprinse despre natura minții, posibilitatea mașinilor inteligente și semnificația testului Turing care a continuat de-a lungul anilor 80 și anii 90.
În 1990, a avut loc cea de-a patruzecea aniversare a publicării lucrării lui Turing „Computing Machinery and the Mind”, reînnoind interesul pentru test. Două evenimente importante au avut loc anul acesta.
Unul dintre ele este Colocviul Turing, care a avut loc în aprilie la Universitatea din Sussex. În cadrul acestuia, academicieni și cercetători din diverse domenii ale științei s-au întâlnit pentru a discuta testul Turing din punctul de vedere al trecutului, prezentului și viitorului său.
A doua evoluție a fost înființarea unui concurs anual pentru Premiul Loebner.
Concursul anual AI Loebner pentru Premiul Loebner este o platformă pentru implementarea practică a testelor Turing. Prima competiție a avut loc în noiembrie 1991 . Premiul este garantat de Hugh Loebner. Centrul Cambridge pentru Cercetare Comportamentală, situat în Massachusetts (SUA), a oferit premii până în 2003. Potrivit lui Loebner, competiția a fost organizată pentru a avansa în domeniul cercetării legate de inteligența artificială, în parte pentru că „nimeni nu a luat măsuri pentru ca acest lucru să se întâmple”.
Medaliile de argint (text) și de aur (audio și vizual) nu au fost niciodată acordate. Cu toate acestea, în fiecare an, dintre toate sistemele informatice prezentate la concurs, juriul acordă o medalie de bronz celui care, în opinia lor, va demonstra cel mai „umane” comportament în conversație. Nu cu mult timp în urmă, programul Artificial Linguistic Internet Computer Entity ( ALICE ) a câștigat de trei ori medalia de bronz (în 2000, 2001 și 2004). Programul de învățare Jabberwacky [3] a câștigat în 2005 și 2006. Creatorii săi au oferit o versiune personalizată: abilitatea de a susține un test de simulare, încercând să simuleze mai precis o persoană cu care aparatul a avut contact intim înainte de test.
Concursul testează capacitatea de a vorbi; Câștigătorii sunt de obicei chatbot-uri sau Entități de conversație artificială (ACE). Regulamentul primelor competiții prevedea o restricție. Conform acestei restricții, fiecare conversație cu programul sau persoana ascunsă ar putea fi pe un singur subiect. De la concursul din 1995, această regulă a fost abolită. Durata conversației dintre judecător și participant a variat de la an la an. În 2003, când competiția a avut loc la Universitatea din Surrey, fiecare judecător putea vorbi cu fiecare participant (mașină sau persoană) exact 5 minute. Din 2004 până în 2007, acest timp a fost deja de peste 20 de minute. În 2008, timpul maxim de convorbire a fost de 5 minute per cuplu, deoarece organizatorul Kevin Warwick și facilitatorul Huma Shah credeau că ACE nu era capabil din punct de vedere tehnic să susțină o conversație mai lungă. Câștigătorul din 2008, Elbot [4] , nu s-a prefăcut a fi om, dar a reușit totuși să-i păcălească pe cei trei judecători. Într-o competiție desfășurată în 2010, timpul de comunicare între sistem și cercetător a fost mărit la 25 de minute la cererea sponsorului (programele au avansat în capacitatea de a imita o persoană și doar cu o conversație lungă apar nuanțe. care vă permit să calculați interlocutorul). Competiția, desfășurată pe 15 mai 2012, s-a desfășurat pentru prima dată în lume cu o transmisie în direct a conversației, ceea ce nu face decât să alimenteze interesul pentru această competiție.
Apariția competiției pentru Premiul Loebner a condus la discuții reînnoite despre oportunitatea testului Turing, despre semnificația promovării acestuia. Articolul Economist „Artificial Stupidity” notează că primul program câștigător a reușit să câștige în parte pentru că „simula greșelile de scriere umane”. (Turing a sugerat ca programele să adauge erori la rezultatele lor pentru a fi mai buni „jucători”). Exista percepția că încercarea de a trece testul Turing a împiedicat pur și simplu cercetări mai fructuoase.
În timpul primelor competiții, a fost identificată o a doua problemă: participarea judecătorilor insuficient de competenți care au cedat manipulărilor organizate cu pricepere și nu a ceea ce poate fi considerat inteligență.
Cu toate acestea, din 2004 filozofi, informaticieni și jurnaliști au luat parte la concurs ca interlocutori.
Jurizarea la concurs este foarte strictă. Experții se pregătesc din timp pentru turneu și selectează întrebări foarte complicate pentru a înțelege cu cine vorbesc. Conversația lor cu programele seamănă cu interogatoriul anchetatorului. Judecătorilor le place, de exemplu, să repete unele întrebări după un anumit timp, deoarece roboții slabi nu știu să urmărească istoria dialogului și pot fi prinși de răspunsuri monotone [5] .
În noiembrie 2005, Universitatea din Surrey a găzduit o întâlnire de o zi a dezvoltatorilor ACE, la care au participat câștigătorii testelor de practică Turing care au avut loc ca parte a competiției pentru Premiul Loebner: Robby Garner (Robby Garner), Richard Wallace (Richard Wallace), Rollo Carpenter (Rollo Carpenter). Vorbitorii invitați au inclus David Hamill, Hugh Loebner și Huma Shah.
În 2008, pe lângă găzduirea unui alt concurs de premii Loebner la Universitatea din Reading, Societatea pentru Studiul Inteligenței Artificiale și Simularea Comportamentului (AISB) a găzduit un simpozion de o zi în care a fost discutat testul Turing. Simpozionul a fost găzduit de John Barnden, Mark Bishop, Huma Sha și Kevin Warwick. Printre vorbitori, s-au numărat directorul RI, baronesa Susan Greenfield , Selmer Bringsjord, biograful de la Turing, Andrew Hodges, și savantul Owen Holland. Nu a apărut niciun acord cu privire la un test Turing canonic, dar Bringsord a sugerat că o primă mai mare ar ajuta testul Turing să treacă mai repede.
2012 a marcat ziua de naștere a lui Alan Turing. Pe parcursul anului au avut loc multe evenimente grozave. Multe dintre ele au fost ținute în locuri care au fost de mare importanță în viața lui Turing: Cambridge, Manchester și Bletchley Park. Anul lui Alan Turing Arhivat pe 11 iunie 2011 la Wayback Machine este organizat de TCAC (Turing Centenary Advisory Committee), oferind sprijin profesional și organizațional pentru evenimentele din 2012. În sprijinul evenimentului sunt implicați și: ACM , ASL , SSAISB , BCS , BCTCS , Bletchy Park , BMC , BLC , CCS , Association CiE , EACSL , EATCS , FoLLI , IACAP , IACR , KGS și LICS .
Pentru a organiza activități pentru a sărbători centenarul nașterii lui Turing în iunie 2012, a fost creat un comitet special a cărui sarcină este să transmită publicului larg, inclusiv copiilor , mesajul lui Turing despre o mașinărie sensibilă, reflectată în filmele de la Hollywood precum Blade Runner . Membrii comitetului: Kevin Warwick, președinte, Huma Shah, coordonator, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, câștigătorii premiului Loebner Robbie Garnet și Fred Roberts. Comitetul este susținut de Women in Technology și Daden Ltd.
La această competiție, rușii, ale căror nume nu au fost dezvăluite, au prezentat programul „ Eugene ” [6] . La 150 de teste efectuate (și de fapt conversații de cinci minute), au participat cinci programe noi, care s-au „pierdut” în rândul a 25 de oameni obișnuiți. Programul „Eugene”, înfățișând un băiat de 13 ani care locuiește în Odesa , a fost câștigător, reușind să inducă în eroare examinatorii în 29,2% din răspunsurile sale. Astfel, programul nu a obținut doar 0,8% să treacă complet testul.
În 2015, compania Nanosemantika și Fundația Skolkovo au susținut testul Turing în competiția rusă. Judecătorii independenți dintre participanții la conferința Startup Village de la Moscova au comunicat cu 8 roboți selectați de consiliul de experți și 8 voluntari lingvistici. După 3 minute de conversație în limba rusă, judecătorii au stabilit care dintre interlocutorii lor era robot și cine nu. Fiecare robot a avut 15 conversații. Competiția a fost câștigată de un robot creat de Ivan Golubev din Sankt Petersburg - „Sonya Guseva”. 47% dintre interlocutori l-au confundat cu o persoană [7] .
Există cel puțin trei versiuni principale ale testului Turing, dintre care două au fost propuse în articolul „Computing Machines and the Mind”, iar cea de-a treia versiune, în terminologia lui Saul Traiger, este interpretarea standard.
Deși există o oarecare dezbatere dacă interpretarea modernă corespunde cu ceea ce a descris Turing sau este rezultatul unei interpretări greșite a lucrării sale, toate cele trei versiuni nu sunt considerate echivalente, punctele forte și punctele slabe ale acestora diferă.
Turing, după cum știm deja, a descris un simplu joc de petrecere care implică minim trei jucători. Jucătorul A este un bărbat, jucătorul B este o femeie, iar jucătorul C, care joacă rolul de vorbitor, are oricare dintre genurile. Conform regulilor jocului, C nu vede nici pe A, nici pe B și poate comunica cu ei doar prin mesaje scrise. Adresând întrebări jucătorilor A și B, C încearcă să determine care dintre ei este bărbat și care este femeie. Sarcina jucătorului A este să încurce jucătorul C, astfel încât să tragă concluzia greșită. În același timp, sarcina jucătorului B este să-l ajute pe jucătorul C să facă o judecată corectă.
În versiunea pe care SG Sterret o numește „Testul jocului de imitație original”, Turing propune ca rolul jucătorului A să fie jucat de un computer. Astfel, sarcina computerului este să se prefacă femeie pentru a deruta jucătorul C. Succesul unei astfel de sarcini este estimat prin compararea rezultatelor jocului când jucătorul A este un computer și rezultatele când jucătorul A este un om.
Acum întrebăm: „Ce se întâmplă dacă aparatul acționează ca jucătorul A în acest joc?” Va lua facilitatorul decizii greșite atunci când jocul este jucat în acest fel la fel de des ca și cum jocul ar fi jucat de un bărbat și o femeie? Aceste întrebări o vor înlocui pe cea inițială: „Pot mașinile să gândească?” Text original (engleză)[ arataascunde] Acum punem întrebarea „Ce se va întâmpla când o mașină ia rolul lui A în acest joc?” Va decide greșit interogatorul la fel de des când jocul este jucat așa cum o face atunci când jocul este jucat între un bărbat și o femeie? Aceste întrebări înlocuiesc originalul nostru, „Pot mașinile să gândească?” |
A doua variantă este propusă de Turing în același articol. Ca și în Testul inițial, rolul jucătorului A este jucat de un computer. Diferența este că rolul jucătorului B poate fi jucat atât de un bărbat, cât și de o femeie.
„Să ne uităm la un anumit computer. Este adevărat că prin modificarea acestui computer pentru a avea suficient spațiu de stocare, creșterea vitezei acestuia și oferirea unui program adecvat, este posibil să se proiecteze un astfel de computer care să îndeplinească în mod satisfăcător rolul jucătorului A într-un joc de simulare, în timp ce rolul de jucătorul B face un bărbat?” Turing, 1950, p. 442.
În această variantă, ambii jucători A și B încearcă să-l convingă pe lider să ia o decizie greșită.
Ideea principală a acestei versiuni este că scopul testului Turing nu este să răspundă la întrebarea dacă o mașină poate păcăli gazda, ci la întrebarea dacă o mașină poate imita sau nu o persoană. Deși există o dezbatere cu privire la dacă Turing a vrut sau nu să spună această opțiune, Sterrett crede că Turing a vrut să spună și, astfel, combină a doua opțiune cu a treia. În același timp, un grup de adversari, printre care și Trager, nu cred. Dar tot a condus la ceea ce s-ar putea numi „interpretarea standard”. În această variantă, jucătorul A este un computer, jucătorul B este o persoană de orice gen. Sarcina prezentatorului este acum să nu determine care dintre ei este bărbat și femeie și care dintre ei este un computer și care este o persoană.
Există un dezacord cu privire la opțiunea avută în vedere Turing. Sterret insistă că munca lui Turing are ca rezultat două versiuni diferite ale testului, care, potrivit lui Turing, nu sunt echivalente una cu cealaltă. Testul care folosește jocul de petrecere și compară ratele de succes se numește Testul inițial al jocului de imitație, în timp ce testul bazat pe conversația judecătorului cu omul și mașina se numește Testul Turing standard, observând că Sterrett îl echivalează cu interpretarea standard. , și nu la a doua versiune a jocului de simulare.
Sterrett este de acord că testul Turing standard (STT) are defectele pe care le evidențiază criticii săi. Dar el crede că, dimpotrivă, testul original bazat pe un joc de imitație (OIG Test - Original Imitation Game Test) este lipsit de multe dintre ele din cauza diferențelor cheie: spre deosebire de STT, nu consideră comportamentul asemănător omului drept criteriu principal, deși consideră comportamentul uman ca un semn al inteligenței mașinii. Este posibil ca o persoană să nu treacă testul OIG, motiv pentru care se crede că aceasta este o virtute a testului pentru inteligență. Eșecul testului înseamnă lipsă de inventivitate: testul OIG, prin definiție, consideră că inteligența este asociată cu inventivitate și nu este pur și simplu „imitarea comportamentului uman în timpul unei conversații”. În general, testul OIG poate fi folosit chiar și în moduri non-verbale.
Cu toate acestea, alți scriitori au interpretat cuvintele lui Turing ca sugerând că jocul de simulare în sine este un test. Ceea ce nu este explicat este modul de a lega această afirmație cu afirmația lui Turing că testul propus de el pe baza jocului de petrecere se bazează pe criteriul frecvenței comparative a succesului în acest joc de imitație, și nu pe posibilitatea de a câștiga o rundă. a jocului.
În scrierile sale, Turing nu explică dacă judecătorul știe că va exista sau nu un computer printre participanții la test. În ceea ce privește OIG, Turing spune doar că jucătorul A ar trebui înlocuit cu o mașină, dar nu spune dacă jucătorul C știe acest lucru sau nu. Când Colby, FD Hilf, AD Kramer testau PARRY, au decis că nu era necesar ca judecătorii să știe că unul sau mai mulți dintre intervievatori vor fi computere. După cum a menționat A. Saygin, precum și alții, acest lucru lasă o amprentă semnificativă asupra implementării și rezultatelor testului.
Punctul forte al testului Turing este că poți vorbi despre orice. Turing a scris că „întrebarea și răspunsul pare potrivită pentru a discuta aproape orice domeniu de interes uman pe care dorim să îl discutăm”. John Hoegeland a adăugat că „simplea înțelegere a cuvintelor nu este suficientă; trebuie să înțelegi și subiectul conversației. Pentru a trece un test Turing bine plasat, o mașină trebuie să folosească limbajul natural, să raționeze, să aibă cunoștințe și să învețe. Testul poate fi îngreunat prin includerea intrării video sau, de exemplu, echiparea unei porți pentru transferul de obiecte: mașina va trebui să demonstreze capacitatea de a vedea și robotică. Toate aceste sarcini împreună reflectă principalele probleme cu care se confruntă teoria inteligenței artificiale.
Puterea și atractivitatea testului Turing provine din simplitatea acestuia. Filosofii conștiinței, psihologia din neurologia modernă nu sunt în măsură să dea definiții pentru „inteligență” și „gândire”, în măsura în care acestea sunt suficient de precise și aplicabile în general mașinilor. Fără o astfel de definiție în întrebările centrale ale filozofiei despre inteligența artificială, nu poate exista un răspuns. Testul Turing, chiar dacă imperfect, cel puțin asigură că poate fi măsurat efectiv. Ca atare, este o soluție pragmatică la întrebări filozofice dificile .
În psihologia sovietică , L. S. Vygotsky și A. R. Luria au dat definiții destul de clare ale „inteligenței” și „gândirii” [8] .
În ciuda tuturor meritelor și faimei sale, testul este criticat din mai multe motive.
Orientarea testului Turing este pronunțată către persoană ( antropomorfism ). Este testată doar capacitatea mașinii de a semăna cu o persoană, și nu inteligența mașinii în general. Testul nu reușește să evalueze inteligența generală a unei mașini din două motive:
Stuart Russel și Peter Norvig susțin că antropocentrismul testului înseamnă că acesta nu poate fi cu adevărat util în proiectarea mașinilor inteligente. „Proiectarea aeronavelor și testele de construcție”, construiesc ei o analogie, „nu vizează ca industria lor să creeze mașini care zboară exact ca porumbeii, pe care chiar și porumbeii înșiși le iau pentru ei” [9] . Din cauza acestei imposibilități, promovarea testului Turing nu este scopul conducerii cercetării științifice sau comerciale (din 2009). Cercetările de astăzi în domeniul inteligenței artificiale au obiective mai modeste și mai specifice.
„Cercetătorii din domeniul inteligenței artificiale au acordat puțină atenție trecerii testului Turing”, notează Russell și Norvig, „deoarece au existat modalități mai simple de a testa programele, de exemplu, să atribuie sarcina direct, mai degrabă decât într-un mod indirect, mai întâi. indicați o întrebare într-o cameră de chat la care sunt conectate atât mașinile, cât și oamenii. Turing nu a intenționat niciodată să-și folosească testul în practică, în măsurarea cotidiană a gradului de rezonabil al programelor; a vrut să ofere un exemplu clar și de înțeles care să susțină discuția despre filosofia inteligenței artificiale.
Trebuie subliniat faptul că Turing nu și-a dezvăluit în detaliu obiectivele și ideea creării unui test. Pe baza condițiilor de trecere, se poate presupune că în vremea lui intelectul uman domina în toate domeniile, adică era mai puternic și mai rapid decât oricare altul. În prezent, însă, unele programe care imită activitatea intelectuală sunt atât de eficiente încât depășesc mintea locuitorului mediu al Pământului în anumite zone înguste. Prin urmare, în anumite condiții, ei pot trece testul.
De asemenea, testul Turing este explicit comportamental sau funcțional : testează doar modul în care acționează subiectul. Aparatul care face testul poate imita comportamentul unei ființe umane într-o conversație pur și simplu urmând „neinteligent” regulile mecanice. Două contraexemple binecunoscute care exprimă acest punct de vedere sunt „ Chineză Room ” a lui Searle (1980) și „Dump” a lui Ned Block (1981). Potrivit lui Searle, principala problemă este de a determina dacă mașina „imită” gândirea sau „de fapt” gândește. Chiar dacă testul Turing este valabil pentru determinarea prezenței inteligenței, Searle notează că testul nu va arăta că o mașină are o minte, conștiință, capacitatea de a „înțelege” sau să aibă scopuri care au vreun sens (filozofii numesc această stabilire a obiectivelor). ).
În lucrarea sa, Turing a scris următoarele despre aceste argumente: „Nu vreau să dau impresia că cred că conștiința nu are ghicitori. Există, de exemplu, un fel de paradox asociat cu orice încercare de a-l localiza. Dar nu cred că aceste ghicitori trebuie dezlegate înainte de a putea răspunde la întrebarea căreia îi este dedicată această lucrare.
Turing a prezis că mașinile vor putea în cele din urmă să treacă testul; de fapt, el se aștepta ca până în anul 2000, mașinile cu 109 biți de memorie (aproximativ 119,2 MiB sau 125 MB ) să poată păcăli 30% dintre judecători într-un test de cinci minute. El a sugerat, de asemenea, că expresia „mașină de gândire” nu ar mai fi considerată un oximoron . El a mai sugerat că învățarea automată ar fi o verigă importantă în construirea de mașini puternice, ceea ce este plauzibil printre cercetătorii moderni din domeniul inteligenței artificiale [10] .
Extrapolând din creșterea exponențială a nivelului de tehnologie de-a lungul mai multor decenii, futuristul Raymond Kurzweil a sugerat că mașinile capabile să treacă testul Turing vor fi produse, aproximativ, în jurul anului 2020. Acest lucru face ecoul legii lui Moore .
Proiectul Long Bet include un pariu de 20.000 USD între Mitch Kapor (Mitch Kapor - pesimist) și Raymond Kurzweil (optimist). Semnificația pariului: Va trece un computer testul Turing până în 2029? Sunt definite și unele condiții de pariu [11] .
Numeroase versiuni ale testului Turing, inclusiv cele descrise mai devreme, au fost discutate de ceva timp.
O modificare a testului Turing în care ținta sau unul sau mai multe roluri ale mașinii și omului sunt inversate se numește test Turing invers. Un exemplu al acestui test este dat în lucrarea psihanalistului Wilfred Bion , care a fost deosebit de fascinat de modul în care activitatea mentală este activată atunci când este confruntat cu o altă minte.
Dezvoltând această idee, RD Hinshelwood a descris mintea ca o „mașină de recunoaștere a minții”, menționând că aceasta ar putea fi considerată un fel de „adăugare” la testul Turing. Acum sarcina computerului va fi să determine cu cine a vorbit: cu o persoană sau cu un alt computer. Acesta a fost această adăugare la întrebare la care încerca Turing să răspundă, dar poate că introduce un standard suficient de înalt pentru a determina dacă o mașină poate „gândi” în modul în care ne referim de obicei la acest concept pentru o persoană.
CAPTCHA este un tip de test Turing invers. Înainte de a permite efectuarea unor acțiuni pe site, utilizatorului i se prezintă o imagine distorsionată cu un set de cifre și litere și o ofertă de a introduce acest set într-un câmp special. Scopul acestei operațiuni este prevenirea atacurilor de către sistemele automatizate de pe site. Motivul pentru o astfel de operațiune este că nu există încă programe suficient de puternice pentru a recunoaște și a reproduce cu acuratețe textul dintr-o imagine distorsionată (sau nu sunt disponibile pentru utilizatorii obișnuiți), așa că se crede că un sistem care a fost capabil să facă acest lucru poate fi considerat cu o mare probabilitate om. Concluzia va fi (deși nu neapărat) că inteligența artificială nu a fost încă creată.
Această variație a testului este descrisă după cum urmează: răspunsul mașinii nu trebuie să difere de răspunsul unui expert - un specialist într-un anumit domeniu de cunoaștere.
Testul de nemurire este o variație a testului Turing care determină dacă caracterul unei persoane este transferat calitativ, și anume dacă este posibil să se distingă caracterul copiat de caracterul persoanei care a servit drept sursă.
MIST a fost propus de Chris McKinstry. În această variantă a testului Turing, sunt permise doar două tipuri de răspunsuri - „da” și „nu”. De obicei, MIST este folosit pentru a colecta informații statistice care pot fi utilizate pentru a măsura performanța programelor care implementează inteligența artificială.
În această variație a testului, un subiect (să zicem, un computer) este considerat sensibil dacă a creat ceva pe care dorește să testeze pentru sensibilitate.
Organizatorii Premiului Hutter consideră că comprimarea textului în limbaj natural este o sarcină dificilă pentru inteligența artificială, echivalentă cu trecerea testului Turing.
Testul de compresie a informațiilor are anumite avantaje față de majoritatea variantelor și variațiilor testului Turing:
Principalele dezavantaje ale unui astfel de test sunt:
Există multe teste de inteligență care sunt folosite pentru a testa oamenii. Este posibil ca acestea să poată fi folosite pentru a testa inteligența artificială. Unele teste (cum ar fi testul C) derivate din Complexitatea Kolmogorov sunt folosite pentru a testa oamenii și computerele.
Două echipe de programatori au reușit să câștige competiția BotPrize, care se numește „versiunea de joc” a testului Turing. Raportul privind rezultatele testului este dat pe site-ul BotPrize, rezultatele acestuia sunt analizate pe scurt de NewScientist.
Testul BotPrize s-a desfășurat sub forma unui joc multiplayer pe computer (Unreal Tournament 2004), ale cărui personaje erau controlate de oameni reali sau de algoritmi de computer [12] .
Potrivit Universității din Reading , într-un test din 6 iunie 2014, organizat de Școala de Inginerie a Sistemelor [13] la universitate și companiile RoboLaw sub conducerea profesorului Kevin Warwick , un test Turing cu drepturi depline a fost promovat pentru prima dată în istorie folosind programul Eugene Goostman [14] [15 ] , dezvoltat la Sankt Petersburg de imigranții din Rusia Vladimir Veselov și Sergey Ulasen și originar din Ucraina Evgeny Demchenko [16] [17] . Un total de cinci supercomputere au participat la testare . Testul a fost o serie de dialoguri scrise de cinci minute. Testul Turing a fost considerat trecut dacă computerul a reușit să inducă în eroare interlocutorul (omul) pentru cel puțin 30% din timpul total. Programul Eugene, cu un rezultat de 33%, a devenit dispozitivul care a recreat artificial intelectul uman - în acest caz, un adolescent de treisprezece ani din Odesa , care „pretinde că știe totul în lume, dar datorită vârstei sale știe. nu stiu nimic”. Aceasta este a doua victorie a programului, dar în 2012 la competiția în cinstea aniversării lui Alan Turing (vezi mai sus), nu a obținut 0,8% pentru a trece complet testul.
Cu toate acestea, criticii susțin că Zhenya Gustman este doar un „chatbot”:
... Mașina se preface a fi doar un copil, dar trecerea cu drepturi depline a testului Turing este imposibilă pentru ea în principiu. Căci testul este doar comportamental; la întrebarea fundamentală - mașina gândește? - nu poate da un răspuns... Aceste întrebări, desigur, pot oferi de lucru pentru generații de filozofi profesioniști, precum și timp liber pentru cercuri vaste de filosofi autodidacți. Dar din punct de vedere al ingineriei sau al afacerilor, ele nu au sens [18] .
Testul Turing folosind întrebări simple, dar ambigue formulate în limbaj obișnuit [19] .
Testul Turing folosind sarcini de testare pentru elevii de școală primară și gimnazială [19] .
Un test Turing care utilizează sarcini pentru a asambla o structură dată dintr-un set de părți folosind instrucțiuni verbale, scrise și desenate [19] .
Testul Turing, care oferă să efectueze prezentarea conținutului fișierului audio și repovestirea intrigii clipului video și alte sarcini similare [19] .
Dicționare și enciclopedii | |
---|---|
În cataloagele bibliografice |
|