Procesarea limbajului natural
Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de
versiunea revizuită pe 23 decembrie 2019; verificările necesită
15 modificări .
Procesarea limbajului natural ( NLP ) este o zonă generală a inteligenței artificiale și a lingvisticii matematice . Studiază problemele analizei computerizate și sintezei de texte în limbi naturale . În ceea ce privește inteligența artificială, analiza înseamnă înțelegerea limbajului, iar sinteza înseamnă generarea de text alfabetizat .
Sarcini și limitări
Teoretic, construirea unei interfețe în limbaj natural pentru computere este un obiectiv foarte atractiv. Sistemele timpurii, cum ar fi SHRDLU , care lucrează cu o „lume a blocurilor” limitată și folosind un vocabular limitat, arătau extrem de bine, inspirându-și creatorii. Cu toate acestea, optimismul a dispărut rapid când aceste sisteme s-au confruntat cu complexitatea și ambiguitatea lumii reale.
Înțelegerea limbajului natural este uneori luată în considerare[ cine? ] AI este o sarcină completă, deoarece recunoașterea unei limbi vii necesită o cunoaștere uriașă a sistemului despre lumea din jurul nostru și capacitatea de a interacționa cu acesta. Însăși definiția sensului cuvântului „ înțelege ” este una dintre sarcinile principale ale inteligenței artificiale. .
Dificultăți de înțelegere
În rusă
Calitatea înțelegerii depinde de mulți factori: limba, cultura națională, interlocutorul însuși etc. Iată câteva exemple de dificultăți cu care se confruntă sistemele de înțelegere a textului.
- Dificultăți în deschiderea anaforelor (recunoașterea a ceea ce se înțelege atunci când se folosesc pronume): propozițiile „Le-am dat bananele maimuțelor pentru că erau foame” și „Le-am dat bananele maimuțelor pentru că erau prea coapte” sunt similare ca structură sintactică. Într-una dintre ele , pronumele se referă la maimuțe, iar în cealaltă, la banane. Înțelegerea corectă depinde de cunoștințele computerului despre ceea ce pot fi bananele și maimuțele.
- Ordinea liberă a cuvintelor poate duce la o interpretare complet diferită a frazei: „Ființa determină conștiința” - ce determină ce?
- În rusă, ordinea liberă este compensată de morfologia avansată , cuvintele funcționale și semnele de punctuație , dar în cele mai multe cazuri, aceasta prezintă o problemă suplimentară pentru un computer.
- Neologismele pot fi găsite în vorbire , de exemplu, verbul „Cincizeci de ruble” - adică trimiteți 50 de ruble. Sistemul ar trebui să poată distinge astfel de cazuri de greșeli de scriere și să le înțeleagă corect.
- Înțelegerea corectă a omonimelor este o altă problemă. În recunoașterea vorbirii , se pune, printre altele, problema omonimelor fonetice. În expresia „Un lup cenușiu s-a întâlnit cu o vulpe roșie într-o pădure adâncă ” Cuvintele evidențiate se aud la fel și fără a ști cine este surd și cine este roșu, nu se poate face (pe lângă faptul că vulpea poate fi roșie și pădurea poate fi surdă, pădurea poate fi și roșie (caracteristică, denotă în acest caz culoarea predominantă a frunzișului din pădure), în timp ce vulpea poate fi surdă, ceea ce creează o problemă suplimentară ce decurge din cea precedentă, deși este parțial compensată de morfologie – adjectivele din această propoziție au un gen net diferit).
Clasificarea sarcinilor
Probleme populare: [1] [2] [3]
- Recunoaștere a vorbirii
- Analiza textului
- Generarea textului
- sinteza vorbirii
Sarcini de analiză și sinteză în complex:
Clasificare generala:
- Clasificarea textului
- Clasificarea secvenţelor de caractere
- Recunoașterea entității numite
- Definirea părților de vorbire a cuvintelor
- Recunoașterea frazei
- Extragerea de informații din text
- Adnotare de sintaxă
- Adnotare semantică
- Generarea textului
- Generarea de text pe baza vorbirii recunoscute
- Traducere automată
- Generalizarea textului
Software
Vezi și
Note
- ↑ Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. Clasificarea textului bazată pe învățarea profundă: o revizuire cuprinzătoare // arXiv:2004.03705 [cs, stat]. — 2020-04-05. Arhivat din original pe 24 iunie 2020.
- ↑ Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. Tendințe recente în procesarea limbajului natural bazat pe învățarea profundă // arXiv:1708.02709 [cs]. — 24.11.2018. Arhivat 6 mai 2020.
- ↑ Prof. Jason Eisner. Curs de procesare automată a textului (engleză) ? . Preluat la 7 mai 2020. Arhivat din original la 13 mai 2020. (nedefinit)
Link -uri
Dicționare și enciclopedii |
|
---|
În cataloagele bibliografice |
|
---|