Gramatica adăugării arborelui

Tree -adjoining grammar TAG ) este o gramatică formală inventată de Aravind Joshi ( în engleză  Această gramatică generalizează gramatica fără context prin faptul că unitățile elementare din regulile de inferență sunt mai degrabă arbori decât caractere individuale. Astfel, gramatica definește regulile pentru înlocuirea nodurilor arborelui cu subarbori (vezi arborele în teoria graficelor și arborele în informatică ).

Istorie

TAG a apărut ca urmare a cercetărilor efectuate de Joshi și studenții săi dintr-o familie de gramatici adjuvante [1] . Gramaticile atașamentului sunt potrivite pentru analizarea expresiilor care includ un cuvânt principal și multe cuvinte dependente care restrâng sensul cuvântului principal (de exemplu, „o casă foarte mare”). Cu toate acestea, ele nu caracterizează clar frazele în care niciun cuvânt nu poate îndeplini funcția întregii structuri. Același lucru este valabil și pentru gramatica cu structură de frază . În 1969, Joshi a introdus o familie de gramatici care exploatează această complementaritate prin amestecarea a două tipuri de reguli. Această familie nu face parte din ierarhia Chomsky [2] și aparține gramaticilor slab sensibile la context , adică în ceea ce privește proprietățile generatoare, este mai puternică decât gramaticile fără context , dar mai slabă decât cele sensibile la context [3] . Gramaticile de adăugare de arbore sunt slab echivalente cu gramaticile indexate liniare , gramaticile categoriale combinatorii și gramaticile de antet [4] (pentru orice gramatică de adăugare de arbore, se poate construi o gramatică corespunzătoare din oricare dintre aceste trei familii care vor genera aceleași șiruri).

Descriere

O regulă TAG este un arbore cu un nod frunză la care poate fi atașat un cuvânt (LTAG).

Există două tipuri de arbori: „inițial” (deseori denumit „ ') și „auxiliar” (' '). Arborele inițial reprezintă valențele principale ale frazei, în timp ce arborii auxiliari permit utilizarea recursiunii [5] . Arborii auxiliari au nodul de sus și nodul de frunză marcate cu același simbol.

Înlocuirile încep de la arborele inițial și se fac prin înlocuire sau adăugare . O înlocuire înlocuiește un nod cu un arbore al cărui nod superior este etichetat cu același simbol ca cel înlocuit. Append inserează un subarboresc auxiliar în centrul arborelui [6] . Un arbore auxiliar trebuie să fie etichetat cu aceeași etichetă ca și nodul la care este atașat.

Note

  1. Joshi, Aravind; S. R. Kosaraju, H. Yamada. Gramatici  adjuncte de șiruri (neopr.) . — Proceedings al zecelea simpozion anual privind teoria automatelor, Waterloo, Canada, 1969.
  2. Joshi, Aravind. Proprietățile gramaticilor formale cu tipuri mixte de reguli și relevanța lor lingvistică  (engleză)  : jurnal. - Proceedings Third International Symposium on Computational Linguistics, Stockholm, Suedia, 1969.
  3. Joshi, Aravind. Cât de multă sensibilitate la context este necesară pentru caracterizarea descrierilor structurale // Procesarea limbajului natural: perspective teoretice, computaționale și psihologice  (engleză) / D. Dowty, L. Karttunen și A. Zwicky, (eds.). - New York, NY: Cambridge University Press , 1985. - P. 206-250.
  4. ^ Vijay-Shanker, K. și Weir, David J. 1994. The Equivalence of Four Extensions of Context-Free Grammars . Teoria sistemelor matematice 27(6): 511-546.
  5. Jurafsky, Daniel; James H. Martin. Procesarea vorbirii și a limbajului  (nedefinită) . - Upper Saddle River, NJ: Prentice Hall , 2000. - p  . 354 .
  6. Joshi, Aravind; Owen Rambow (2003). „Un formalism pentru gramatica dependenței bazat pe gramatica adiacentă arborelui” (PDF) . Proceedings of Conference on Meaning-Text Theory . Parametrul depreciat folosit |coauthors=( ajutor ) Arhivat pe 29 noiembrie 2020 la Wayback Machine

Link -uri

În limba engleză: