Analiza de suprafață ( eng. parsing superficial, chunking, light parsing ) este o metodă de analiză a propoziției în care părțile constitutive ale unei propoziții (substantive, verbe, adjective etc.) sunt mai întâi identificate și apoi sunt legate în elemente de ordin superior. care au sens gramatical ( grupuri sau fraze nominale , grupuri de verbe etc.).
În timp ce algoritmii simpli de analiză a suprafeței leagă părțile constitutive folosind modele de căutare elementare (de exemplu, expresii regulate ), abordările bazate pe învățarea automată ( clasificatoare , modelare de subiecte etc.) pot lua în considerare informațiile contextuale și pot forma fragmente care reflectă mai bine legăturile semantice dintre cuvintele principale [1] . Astfel, aceste metode îmbunătățite rezolvă problema că o combinație de constituenți elementari poate avea semnificații diferite la cel mai înalt nivel în funcție de contextul propoziției.
Similar cu analiza lexicală în limbaje informatice, această tehnică este utilizată pe scară largă în procesarea limbajului natural .
Denumită Ipoteza structurii superficiale , este folosită pentru a explica de ce cei care învață limba a doua nu reușesc adesea să analizeze corect propozițiile complexe [2] .
procesarea limbajului natural | |
---|---|
Definiții generale | |
Analiza textului |
|
Referire |
|
Traducere automată |
|
Identificarea și colectarea datelor | |
Model tematic | |
Evaluare inter pares |
|
Interfață în limbaj natural |