Corereferința sau identitatea referențială este relația dintre nume - componente ale enunțului, în care numele se referă la același obiect (situație) al realității extralingvistice ( referent ) [1] .
Datorită coreferenței, un text poate fi făcut coerent, adesea, dar nu neapărat, sub forma unei relații anaforice (un cuvânt pronominal sau un sens definit - un pronume ).
Relația anaforică „cuvânt pronominal - pronume”: „ Cartea este pe masă. E grea.”
Relația anaforică „sensul certitudinii este un pronume”: „ Cartea este pe masă. Tom este greu.”
Metonimie : „ Scriitorul a făcut publicul să se citească singur ”. (aici însuși - lucrările scriitorului)
Un nume în sistemele informaționale cu o formă tabelară de prezentare a informațiilor ( baze de date , site-uri web , foi de calcul etc.) este reprezentat de un atribut sau un set de atribute ale unui tuplu (pentru sintagmele nominale). Diferitele nume caracter cu simbol în astfel de sisteme pot fi coreferențiale, iar atributele care le conțin pot fi echivalente din punct de vedere semantic . De exemplu, numele „agent de curățare” este coreferențial cu numele „agent de curățare” . [2]
Fără îndoială, în absența unor reguli speciale, denumirile coreferențiale vor fi introduse de către operatorii diferitelor sisteme informatice caracter cu caracter diferit. De obicei, problema determinării echivalenței semantice a atributelor simbolice este considerată de nerezolvată din punct de vedere algoritmic. La nivelul soluțiilor software individuale, statele și comunitatea mondială în ansamblu folosesc tehnologii care fac posibilă transferarea implicită a funcției de comparare a numelui către operatorul computerului și prezentarea rezultatului sub forma unui cod, sau într-un alt algoritm convenabil. formă.
Progresele în analiza computerizată a limbilor naturale fac posibilă crearea de sisteme informaționale pentru rezolvarea unor astfel de probleme în care introducerea denumirilor de cod sau a standardelor de denumire este imposibilă. Sistemul Price.ru de căutare a informațiilor despre bunuri poate fi considerat un pionier în Runet pentru compararea automată a semanticii numelor . Utilizează metodele sistemelor de regăsire a informațiilor, ceea ce vă permite să stabiliți toleranța semantică a diferitelor nume.
Majoritatea cercetărilor și publicațiilor sunt legate de automatizarea stabilirii relațiilor coreferențiale într-un text în limbaj natural. Utilizarea modelelor semantice specifice domeniului face posibilă efectuarea eficientă a unei comparații semantice a numelor caracter cu caracter în baze de date pentru diverse scopuri aplicate.