Procesarea limbajului natural

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 23 decembrie 2019; verificările necesită 15 modificări .

Procesarea limbajului natural ( NLP ) este o zonă generală a inteligenței artificiale și a lingvisticii matematice . Studiază problemele analizei computerizate și sintezei de texte în limbi naturale . În ceea ce privește inteligența artificială, analiza înseamnă înțelegerea limbajului, iar sinteza înseamnă generarea de text alfabetizat .

Sarcini și limitări

Teoretic, construirea unei interfețe în limbaj natural pentru computere este un obiectiv foarte atractiv. Sistemele timpurii, cum ar fi SHRDLU , care lucrează cu o „lume a blocurilor” limitată și folosind un vocabular limitat, arătau extrem de bine, inspirându-și creatorii. Cu toate acestea, optimismul a dispărut rapid când aceste sisteme s-au confruntat cu complexitatea și ambiguitatea lumii reale.

Înțelegerea limbajului natural este uneori luată în considerare[ cine? ] AI este o sarcină completă, deoarece recunoașterea unei limbi vii necesită o cunoaștere uriașă a sistemului despre lumea din jurul nostru și capacitatea de a interacționa cu acesta. Însăși definiția sensului cuvântului „ înțelege ” este una dintre sarcinile principale ale inteligenței artificiale. .

Dificultăți de înțelegere

În rusă

Calitatea înțelegerii depinde de mulți factori: limba, cultura națională, interlocutorul însuși etc. Iată câteva exemple de dificultăți cu care se confruntă sistemele de înțelegere a textului.

Clasificarea sarcinilor

Probleme populare: [1] [2] [3]

  1. Recunoaștere a vorbirii
  2. Analiza textului
  3. Generarea textului
  4. sinteza vorbirii

Sarcini de analiză și sinteză în complex:

Clasificare generala:

  1. Clasificarea textului
  2. Clasificarea secvenţelor de caractere
    1. Recunoașterea entității numite
    2. Definirea părților de vorbire a cuvintelor
  3. Recunoașterea frazei
  4. Extragerea de informații din text
  5. Adnotare de sintaxă
  6. Adnotare semantică
  7. Generarea textului
    1. Generarea de text pe baza vorbirii recunoscute
    2. Traducere automată
    3. Generalizarea textului

Software

Vezi și

Note

  1. Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. Clasificarea textului bazată pe învățarea profundă: o revizuire cuprinzătoare  // arXiv:2004.03705 [cs, stat]. — 2020-04-05. Arhivat din original pe 24 iunie 2020.
  2. Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. Tendințe recente în procesarea limbajului natural bazat pe învățarea profundă  // arXiv:1708.02709 [cs]. — 24.11.2018. Arhivat 6 mai 2020.
  3. Prof. Jason Eisner. Curs de procesare automată a textului  (engleză)  ? . Preluat la 7 mai 2020. Arhivat din original la 13 mai 2020.

Link -uri