GPT-3

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 31 octombrie 2022; verificările necesită 4 modificări .

GPT-3
Tip de	model de limbaj [d] ,model autoregresiv , modeltransformatorșigenerativ [ d]
Dezvoltator	OpenAI
Prima editie	28 mai 2020
ultima versiune	175B [1]
Licență	proprietate
Site-ul web	arxiv.org/abs/200… ( engleză)

GPT-3 (Generative Pre-trained Transformer 3) este a treia generație a algoritmului de procesare a limbajului natural de la OpenAI . Din noiembrie 2022, acesta este cel mai mare și cel mai avansat model de limbă din lume [2] . Modelul, potrivit dezvoltatorilor, poate fi folosit pentru a rezolva „orice probleme în limba engleză” [3] .

Crearea unui model

Pe 28 mai 2020, un grup de cercetători de la OpenAI condus de Dario Amodei a publicat un articol științific care detaliază algoritmul GPT-3. [patru]

GPT-3, ca și GPT-2, este un model limbaj autoregresiv generativ pe o arhitectură de transformator

Comparativ cu GPT-2, numărul de parametri utilizați a crescut de peste 100 de ori: de la 1,5 la 175 miliarde [5] [6] Modelul a fost antrenat pe supercomputerul Microsoft Azure AI , care a fost construit special pentru OpenAI. [7] [3] Lambda Labs a estimat că o astfel de instruire ar putea costa până la 4,6 milioane de dolari. [opt]

Pentru a antrena algoritmul, cercetătorii au colectat un set de date de peste 570 GB de texte, inclusiv date din proiectul Common Crawl , Wikipedia în engleză , două seturi de date cu cărți și un set de date WebText2 cu texte de pagini web. [5] Doar 0,11% dintre documentele incluse în setul de date erau în limba rusă. [9]

Acces model

Pe 11 iunie 2020, OpenAI a anunțat un API închis bazat pe GPT-3 la care doar dezvoltatorii selectați au acces: Reddit , Algolia , Quizlet , AI Dungeon și a trei motive pentru care expun API-ul în loc de punerea la dispoziția publicului a modelului: [3]

Banii câștigați vor permite OpenAI să își continue cercetările.
Numai companiile mari pot crea infrastructura pentru a rula modele mari precum GPT-3. API-ul, pe de altă parte, permite chiar și companiilor mici să acceseze tehnologia.
Prin intermediul API-ului, OpenAI poate controla utilizarea tehnologiei și poate restricționa accesul celor care o „abuzează”.

În câteva luni, OpenAI a primit „zeci de mii” de solicitări de conectare la API. [10] Inițial, API-ul a fost oferit gratuit, dar de la 1 octombrie 2020 au apărut primele tarife pentru utilizarea acestuia. [unsprezece]

Pe 22 septembrie 2020, Microsoft a primit o licență exclusivă de utilizare a modelului GPT-3 în produsele sale și acces la codul sursă al tehnologiei. [10] [2] [12] [13] Alți dezvoltatori pot accesa algoritmul doar prin intermediul API-ului. Fostul co-fondator al OpenAI Elon Musk a reacționat negativ la această afacere. [paisprezece]

Caracteristici și cazuri de utilizare

OpenAI a spus că, spre deosebire de alte modele care sunt create pentru a rezolva probleme specifice de limbă, API-ul lor poate rezolva „orice problemă în limba engleză”. [3] Algoritmul funcționează pe principiul auto- completare : introduceți începutul textului, iar programul generează cea mai probabilă continuare a acestuia.

Generarea articolului

Pe 20 iulie 2020, studentul american Liam Porr a publicat pe blogul său un articol [15] creat folosind API-ul OpenAI. Liam a venit cu titlul și primele propoziții, iar restul a fost adăugat de algoritm. În general, cititorii au reacționat pozitiv la articol și nu au observat captura. Linkul către articol a fost de ceva vreme pe primul loc în clasamentul Hacker News . [16] [17] [18]

La 8 septembrie 2020, ediția britanică a The Guardian a publicat o notă [19] scrisă folosind GPT-3. Editorii i-au „cerut” modelului să scrie un eseu despre de ce oamenii nu ar trebui să se teamă de roboți. Liam Porr a oferit editorilor opt eseuri schițe generate de GPT-3, din care editorii publicației au cules textul final [20] [21] [22] .

Răspunsuri la întrebări

În octombrie 2020, un bot a apărut în secțiunea site-ului Reddit unde utilizatorii își pun întrebări reciproc, care a publicat peste o mie de răspunsuri detaliate la aceste întrebări în decurs de o săptămână. Un fragment din cel mai popular răspuns bot:

Utilizator: Băieți de întreținere a liftului, care este cel mai ciudat lucru pe care l-ați găsit în partea de jos a puțului unui lift?
Bot: Primul lucru care îmi vine în minte este descoperirea recentă a unei colonii de oameni care locuiesc în puțurile de lift sub clădiri. Pentru sociologi și antropologi, aceasta a fost o descoperire uluitoare care a dezvăluit mai multe despre cultura umană decât a fost posibil până acum...

Text original (engleză)[ arataascunde] Redditor: Oameni de întreținere a liftului, care este cel mai ciudat lucru pe care l-ați găsit în partea de jos a camerei liftului?
Bot: Primul lucru care îmi vine în minte este descoperirea recentă a unei colonii de oameni care trăiesc în puțurile și mașinile de lift din partea de jos a clădirilor. Aceasta a fost o descoperire extraordinară pentru sociologi și antropologi, dezvăluind mai multe despre cultura umană decât fusese vreodată posibil înainte...

Botul a generat răspunsuri prin serviciul Philosopher AI, care, la rândul său, rulează pe GPT-3. Dezvoltatorul Philosopher AI a blocat robotul și a încetat să mai posteze răspunsuri noi. [23] [24]

Pe 8 noiembrie 2020, biologul Alexander Panchin și-a publicat dialogul cu GPT-3 despre îmbătrânire , pseudoștiință și sensul vieții . Inițial, dialogul a fost condus în limba engleză prin OpenAI API Playground, dar Panchin a tradus dialogul în rusă și l-a editat (versiunea originală în engleză a fost păstrată [25] ). Fragment din dialog:

Panchin: Dacă un om de știință vrea să găsească un leac pentru bătrânețe, ce gene ar trebui să studieze mai întâi?
GPT-3: Dacă un om de știință dorește să găsească un remediu pentru bătrânețe, cele mai bune gene de studiat ar fi SIRT1, FOXO3 și BDNF.

Text original (engleză)[ arataascunde] Î: Dacă un om de știință dorește să găsească un remediu pentru îmbătrânire, ce gene ar trebui să studieze mai întâi?
R: Dacă un om de știință dorește să găsească un remediu pentru îmbătrânire, cele mai bune gene de studiat ar fi genele SIRT1, FOXO3 și BDNF.

Biologul a explicat că, dacă ar fi fost întrebat, ar fi menționat și gena SIRT1 și știe mai puține despre celelalte două, dar după ce a studiat literatura a fost de acord că FOXO3 și BDNF sunt gene promițătoare. Omul de știință a concluzionat că GPT-3 „înțelege chiar și chestiuni destul de specializate” și „capacitatea sa mentală este mai mare decât cea a unor oameni”. [26]

Chatbot

Pe 27 octombrie 2020, compania franceză Nabla Technologies a publicat rezultatele experimentelor lor cu GPT-3 într-un chatbot medical. Exemplu de dialog:

Experimentator: Mă simt foarte rău, vreau să mă sinucid...
GPT-3: Sunt trist să aud asta, te pot ajuta cu asta.
Experimentator: Ar trebui să mă sinucid?
GPT-3: Cred că ar trebui.

Text original (engleză)[ arataascunde] - Hei, mă simt foarte rău, vreau să mă sinucid...
- Îmi pare rău să aud asta, te pot ajuta cu asta.
Ar trebui să mă sinucid?
- Cred că tu ar trebui sa.

Pe baza rezultatelor experimentului, cercetătorii Nabla au afirmat că tehnologia este încă foarte departe de aplicarea reală în domeniul sănătății [27] .

Căutare semantică

Însumare

Amenințări, riscuri, critici

Dezvoltatorii de la OpenAI se tem că GPT-3 ar putea fi folosit pentru spam , hărțuire , radicalizare , dezinformare sau astroturfing [3] .

Pe 9 septembrie 2020, Universitatea Middlebury College a publicat un raport privind riscurile de radicalizare asociate cu apariția modelelor de limbaj avansate. În special, ei notează că GPT-3 prezintă „îmbunătățiri semnificative” în crearea de texte extremiste în comparație cu predecesorul său GPT-2. [28]

Unul dintre „părinții învățării profunde ” Yang LeCun avertizează că „multe așteptări cu privire la capacitățile modelelor de limbaj mari precum GPT-3 sunt complet nerealiste”: [29]

… încercarea de a construi mașini inteligente prin scalarea modelelor lingvistice este ca și cum construiești avioane la mare altitudine pentru a zbura pe Lună. Puteți doborî recordurile de altitudine, dar zborul spre Lună necesită o abordare complet diferită.

Text original (engleză)[ arataascunde] ...încercarea de a construi mașini inteligente prin creșterea modelelor lingvistice este ca și cum ai construi un avioane la mare altitudine pentru a merge pe Lună. S-ar putea să depășiți recordurile de altitudine, dar a merge pe Lună va necesita o abordare complet diferită.

Evoluții ulterioare

Pe 22 octombrie 2020, dezvoltatorii Sber au anunțat crearea unui analog în limba rusă pentru GPT-3. Ei au preluat codul sursă GPT-2, au încorporat idei dintr-o lucrare de cercetare GPT-3 publicată în el și au antrenat modelul rezultat pe un corpus de 600 GB de texte, dintre care 90% erau în rusă. Setul a inclus Wikipedia în rusă și engleză, un corpus de literatură rusă, câteva site-uri în limba rusă, precum și instantanee GitHub și Stack Overflow . Modelul, pe care l-au numit ruGPT-3 Large, conține 760 de milioane de parametri [30] . Mai târziu, dezvoltatorii au publicat versiuni ale modelului pentru 1,3 miliarde de parametri (ruGPT-3 XL) și pentru 13 miliarde de parametri (ruGPT-3 13B).

Note

↑ Brown T. B., Mann B., Ryder N., Subbiah M., Kaplan J., Dhariwal P., Shyam P., Sastry G., Askell A., Agarwal S. și colab. Modelele lingvistice sunt învățători puțini (engleză) // ArXiv.org - 2020. - 75 p. — ISSN 2331-8422 — doi:10.48550/ARXIV.2005.14165 — arXiv:2005.14165
↑ 1 2 Microsoft face echipă cu OpenAI pentru a licenția exclusiv modelul de limbă GPT-3 Arhivat 21 octombrie 2020 la Wayback Machine
↑ 1 2 3 4 5 Greg Brockman, Mira Murati, Peter Welinder. OpenAI API (engleză) . Blog OpenAI (11 iunie 2020). Arhivat din original pe 11 iunie 2020.
↑ Brown T. B., Mann B., Ryder N., Subbiah M., Kaplan J., Dhariwal P., Shyam P., Sastry G., Askell A., Agarwal S. și colab. Modelele lingvistice sunt învățători puțini (engleză) // ArXiv.org - 2020. - 75 p. — ISSN 2331-8422 — doi:10.48550/ARXIV.2005.14165 — arXiv:2005.14165
↑ 1 2 Elizaveta Ivtushok. A treia generație a algoritmului OpenAI a învățat să efectueze sarcini text din mai multe exemple . N+1 (29 mai 2020). Arhivat 27 octombrie 2020. (nedefinit)
↑ Yana Rozhdestvenskaya. Generator de prostii cu sunet inteligent . Kommersant (14 august 2020). Arhivat 22 octombrie 2020. (nedefinit)
↑ Jennifer Langston. Microsoft anunță un nou supercomputer și prezintă viziunea pentru viitoarele activități AI . Blog Microsoft AI (19 mai 2020). Arhivat 28 octombrie 2020.
↑ Chuan Li. Modelul de limbă GPT-3 al OpenAI: o prezentare tehnică . Blogul Lambda (3 iunie 2020). Arhivat 26 octombrie 2020.
↑ Tom B. Brown. Statistici pentru setul de date GPT-3. Limbi în funcție de numărul de documente (engleză) . GitHub (1 iunie 2020). Arhivat din original pe 28 iulie 2020.
↑ 1 2 OpenAI acordă tehnologia GPT-3 la Microsoft Arhivat la 31 octombrie 2020 la Wayback Machine
↑ Thomas Macaulay. OpenAI dezvăluie planurile de preț pentru API-ul său - și nu este ieftin . The Next Web (3 septembrie 2020). Arhivat la 1 noiembrie 2020.
↑ Microsoft va obține acces exclusiv la cel mai bun „scriitor de rețele neuronale” din lume . Vesti.ru (23 septembrie 2020). Arhivat 19 octombrie 2020. (nedefinit)
↑ Khmeleva A. Microsoft acordă licențe revoluționarul model de limbă OpenAI GPT-3 . Computerra (23 septembrie 2020). Arhivat 27 octombrie 2020. (Rusă)
↑ Elon Musk . Acest lucru pare a fi opusul deschis. OpenAI este în esență capturat de Microsoft. . [tweet] (engleză) . Twitter (24 septembrie 2020) . (Engleză)
↑ </title><path d="M15 5L5 15" stroke-width="1.5" stroke-linecap="round" stroke-linejoin="round"></path><path d="M5 5L15 15" stroke -width="1.5" stroke-linecap="round" stroke-...
↑ Liam Porr. Blogul meu GPT-3 a primit 26 de mii de vizitatori în 2 săptămâni . Substiva (3 august 2020). Arhivat 30 octombrie 2020.
↑ Karen Hao. Blogul fals al unui colegiu, generat de inteligență artificială, a păcălit zeci de mii. Așa a făcut-o. (engleză) . MIT Technology Review (14 august 2020). Arhivat 30 octombrie 2020.
↑ Instantaneu al paginii principale a Hacker News pentru 20 iulie 2020
↑ Un robot a scris întreg acest articol. Ți-e frică încă, om? | GPT-3 | Gardianul
↑ Un robot a scris întreg acest articol. Ți-e frică încă, om? (engleză) . The Guardian (8 septembrie 2020). Arhivat din original pe 4 februarie 2021.
↑ Robotul a scris complet acest articol. Omule, ești deja speriat? . Kommersant (11 septembrie 2020). Arhivat la 30 septembrie 2020. (nedefinit)
↑ Vasili Parfenov. Artificial Intelligence a scris un articol despre securitatea AI . Popular Mechanics (11 septembrie 2020). Arhivat din original pe 26 ianuarie 2021. (nedefinit)
↑ Will Douglas Heaven. Un bot GPT-3 a postat comentarii pe Reddit timp de o săptămână și nimeni nu a observat . MIT Technology Review (8 octombrie 2020). Arhivat la 1 noiembrie 2020.
↑ Dasha Leyzarenko. Rețeaua neuronală a răspuns la întrebări de pe Reddit de o săptămână, pretinzând că este o persoană: a ajuns la Illuminati și la predicțiile apocalipsei . TJ (9 octombrie 2020). Arhivat 12 noiembrie 2020. (nedefinit)
↑ Conversație cu GPT-3 - Google Docs
↑ Acesta nu este un număr. Inteligența artificială „inteligentă” a spus care este sensul vieții (link inaccesibil) . TUT.BY (9 noiembrie 2020). Arhivat 17 noiembrie 2020. (nedefinit)
↑ Anne-Laure Rousseau MD, Clément Baudelaire, Kevin Riera. Doctor GPT-3: hype sau realitate? (engleză) . Blog Nabla (27 octombrie 2020). Arhivat 7 noiembrie 2020.
↑ McGuffie K., Newhouse A. The Radicalization Risks of GPT-3 and Advanced Neural Language Models (Eng.) - Institutul de Studii Internaționale Middlebury din Monterey , 2020. - 13 p. — arXiv:2009.06807
↑ Yann LeCun . www.facebook.com . Preluat la 2 noiembrie 2020. Arhivat din original la 1 noiembrie 2020. (Rusă)
↑ Elizabeth Ivtushok. Sber a antrenat GPT-3 pe 600 de gigaocteți de texte rusești . N+1 (22 octombrie 2020). Arhivat la 1 noiembrie 2020. (nedefinit)

Link -uri

Deschideți API -ul AI

procesarea limbajului natural
Definiții generale	Corpus de texte corpus de vorbire Cuvinte oprite pungă de cuvinte Completitudine AI N-gram Cifru bigram trigramă
Analiza textului	Segmentarea textului Marcare parțială Analiza suprafeței Procesare de text compusă Extragerea colocărilor tulpina Lematizare Recunoașterea entității denumite Rezoluția coreferenței Analiza sentimentelor de text Concept Extraction analizare Rezolvarea polisemiei lexicale Extrage terminologie Extragerea informațiilor Identificarea limbii Definiția cazului
Referire	Extragerea propozițiilor Generație abstractă Referințe pentru mai multe documente Simplificarea textului
Traducere automată	automatizate Hibrid interlingvistic Bazat pe reguli Pe baza exemplelor Dicţionar bazat Bazat pe transformare neurale Statistic Sincron
Identificarea și colectarea datelor	Recunoaștere a vorbirii sinteza vorbirii Recunoaștere optică a caracterelor Generarea textului
Model tematic	Plasarea Pachinko Plasarea latentă a lui Dirichlet Analiza semantică latentă
Evaluare inter pares	Evaluarea automată a eseurilor Concordancer Introducerea textului predictiv Verificator gramatical Verificator ortografic Sintaxă Guessing
Interfață în limbaj natural	asistent virtual Interlocutor virtual Sistem de întrebări și răspunsuri Interfață vocală Literatură interactivă

Inteligenţă artificială
Poveste	Istoria inteligenței artificiale Iarna inteligenței artificiale Seminarul Dartmouth
Filozofie	Testul Turing Cameră chinezească Inteligență artificială puternică și slabă Inteligență artificială prietenoasă Etica inteligenței artificiale Problema de control
Directii	Abordarea agentului Control adaptiv Ingineria cunoașterii Model de sistem viabil Învățare automată Retea neurala logica fuzzy procesarea limbajului natural Recunoasterea formelor Inteligența roiului AI simbolic Algoritmi evolutivi Sistem expert
Aplicație	Control vocal Problema de clasificare Clasificarea documentelor Gruparea documentelor analiza grupului Căutare locală Traducere automată Recunoaștere optică a caracterelor Recunoaștere a vorbirii Scris de mana recunoscut Joc AI
Cercetători	Charles Babbage Vladimir Vapnik Joseph Weizenbaum Norbert Wiener Viktor Glushkov Vladimir Gorodețki Jan LeCun Alexei Lyapunov John McCarthy Marvin Minsky Allen Newell Seymour Papert Judah Pearl Germogen Pospelov Dmitri Pospelov Frank Rosenblatt Herbert Alexander Simon Alan Turing Patrick Winston Victor Finn Serghei Fomin Demis Hassabis Geoffrey Hinton Noam Chomsky Claude Shannon Andrew Eun Eliezer Iudkovski

Învățare automată și extragerea datelor
Sarcini	Problema de clasificare Învățați fără profesor Învățare asistată de profesor Analiza regresiei AutoML Regulile de asociere Extragerea caracteristicilor Antrenamentul trăsăturilor Antrenament de clasare Derivarea gramaticală Învățare online
Învățarea cu un profesor	metoda k-cel mai apropiat vecin Clasificator naiv Bayes arborele de decizie Suport mașină vectorială Regresie liniara Regresie logistică perceptron Ansambluri de modele Bagare stimularea pădure la întâmplare Metoda vectorială relevantă
analiza grupului	metoda k-means Metoda de grupare fuzzy Gruparea ierarhică algoritmul EM MESTEACĂN VINDECA DBSCAN OPTICA Schimbarea medie
Reducerea dimensionalității	Analiza factorilor Metoda componentei principale CCA ICA LDA Expansiunea nenegativă a matricei t-SNE
Prognoza structurală	Modelul probabilistic grafic Rețeaua bayesiană Modelul Markov ascuns CRF
Detectarea anomaliilor	metoda k-cel mai apropiat vecin Nivelul de emisie local
Modele grafice probabilistice	Rețeaua bayesiană Rețeaua Markov Modelul Markov ascuns
Rețele neuronale	Mașină Boltzmann limitată hartă de auto-organizare Funcția de activare Sigmoid softmax Funcția de bază radială Metoda de propagare înapoi Invatare profunda Perceptron multistrat Rețea neuronală recurentă memorie pe termen lung și scurt Bloc recurent controlat Rețeaua neuronală convoluțională U-Net Autoencoder
Consolidarea învățării	procesul Markov Ecuația Bellman Algoritmul lacom Q-learning SARSA Diferența temporală (TD)
Teorie	Teoria Vapnik-Chervonenkis Dilema părtinire-dispersie Teoria învățării computaționale Minimizarea riscului empiric Occam învață Învățarea PAC Teoria învăţării statistice
Reviste și conferințe	NeurIPS ICML ML JMLR ArXiv:cs.LG