Traducere automată interactivă

Traducerea automată interactivă ( IMT ) este un subset specializat al domeniului traducerii pe calculator . Paradigma traducerii este că software -ul de calculator ajută traducătorul încercând să prezică textul pe care ar trebui să îl introducă utilizatorul, având în vedere toate informațiile pe care le are la dispoziție. Când o astfel de presupunere este incorectă, sistemul oferă feedback utilizatorului și se face o nouă predicție având în vedere noile informații. Acest proces se repetă până când o traducere corespunde așteptărilor utilizatorului.

Traducerea automată interactivă este deosebit de interesantă pentru traducerea textelor în zonele în care traducerea cu erori nu este permisă și, prin urmare, un utilizator uman este obligat să facă modificări la traducerea furnizată de sistem. În astfel de cazuri, traducerea automată interactivă este îmbunătățită pentru a oferi beneficii potențialilor utilizatori. [1] [2] Cu toate acestea, nu există programe comerciale care să implementeze traducerea automată interactivă, iar până acum munca se află în domeniul cercetării academice .

Istorie

Din punct de vedere istoric, traducerea automată interactivă a luat naștere ca o dezvoltare a paradigmei traducerii asistate de computer , în care traducătorul și sistemele de traducere automată sunt proiectate să funcționeze în tandem . [3] Această primă lucrare a fost extinsă de proiectul de cercetare finanțat de guvernul canadian TransType . În acest proiect , interacțiunea om-calculator a avut ca scop obținerea textului final prin introducerea unor tehnici de traducere automată bazate pe traducerea interactivă transferată în mediu pentru a obține cele mai bune calități ale ambelor tehnici: eficiența unui sistem automat și fiabilitatea un traducător uman.

Ulterior, proiectul de cercetare mai amplu TransType2 [1] [2] , finanțat de Comisia Europeană , a continuat această activitate prin analizarea implementării unui sistem complet de traducere automată în proces , cu scopul de a obține ipoteze de traducere complete pe care un utilizator uman le poate modifica sau accepta. Dacă utilizatorul decide să schimbe ipoteza, sistemul încearcă să folosească cât mai bine acest feedback pentru a produce o nouă traducere a ipotezei care ține cont de modificările efectuate de utilizator.

Mai recent, CASMACAT , [4] finanțat tot de Comisia Europeană , s-a concentrat pe dezvoltarea de noi tipuri de asistență pentru traducători și pe integrarea acestora într-un mediu de dezvoltare nou format dintr-un editor, un server și instrumente de analiză și vizualizare. Mediul de dezvoltare a fost proiectat într-o manieră modulară și poate fi combinat cu instrumentele de traducere automată existente. În plus, cadrul CASMACAT poate învăța din interacțiunea cu traducătorul, actualizându-și și corectându-și modelele imediat pe baza alegerii traducerii de către utilizator. [5] [6]

Lucrările recente care au implicat o gamă largă de utilizatori [7] au relevat faptul că traducerea automată interactivă poate fi utilizată chiar și de către acei utilizatori care nu vorbesc limba originală pentru a obține o calitate aproape profesională a traducerii. În plus, sugerează, de asemenea, că scenariul interactiv este mai benefic decât scenariul clasic post-publicare.

Proces

Procesul interactiv de traducere automată începe cu sistemul care oferă utilizatorului o ipoteză de traducere. Apoi utilizatorul poate fie să accepte oferta în întregime, fie să o modifice dacă consideră că există unele erori. De obicei, atunci când se schimbă un anumit cuvânt, se presupune că prefixul (propoziția) dinaintea cuvântului respectiv este corect, de exemplu. schema de interacțiune - de la stânga la dreapta. După ce utilizatorul a schimbat cuvântul pe care îl consideră incorect, sistemul sugerează un nou sufix, adică restul propoziției. Acest proces continuă până când utilizatorul este mulțumit de traducere.

Deși această explicație este la nivel de cuvânt, procesul anterior se poate face și la nivel de caracter și, prin urmare, sistemul furnizează sufixul ori de câte ori traducătorul introduce un singur caracter. În plus, eforturile sunt în curs de desfășurare pentru a schimba modelul tipic de interacțiune de la stânga la dreapta pentru a ușura interacțiunea om-mașină . [8] [9]

O abordare similară este utilizată în instrumentul de traducere Caitra .

Evaluare

Evaluarea este o problemă complexă în traducerea automată interactivă. În mod ideal, evaluarea ar trebui făcută în experimente cu utilizatori. Cu toate acestea, având în vedere valoarea monetară mare, aceasta înseamnă că acest lucru este rareori cazul. Mai mult, chiar și atunci când luăm în considerare adevărata evaluare a tehnologiilor interactive de traducere automată de către traducători, nu este clar ce ar trebui măsurat în astfel de experimente, deoarece există multe variabile diferite care trebuie luate în considerare și nu pot fi controlate, cum ar fi timpul necesar. de către utilizator pentru a se obișnui cu procesul. În cadrul proiectului CASMACAT, au fost efectuate câteva studii de teren pentru a examina unele dintre aceste variabile. [10] [11] [12]

Pentru o evaluare rapidă într-un cadru de laborator, traducerea automată interactivă este evaluată folosind numărul de apăsări de taste sau numărul de cuvinte introduse . Astfel de criterii încearcă să măsoare câte apăsări de taste sau cuvinte introduse de utilizator trebuie introduse înainte de a obține o traducere finală a documentului. [2]

Diferențele față de traducerea automată clasică

Deși traducerea automată interactivă este un subdomeniu al traducerii asistate de calculator , principala caracteristică atractivă discutată în legătură cu aceasta din urmă este interactivitatea. În traducerea automată clasică, sistemul de traducere poate sugera în cel mai bun caz o singură ipoteză de traducere, iar apoi utilizatorul trebuie să editeze astfel de ipoteze. În schimb, în traducerea automată interactivă, sistemul produce o traducere a unei noi ipoteze de fiecare dată când utilizatorul interacționează cu sistemul, adică după fiecare cuvânt (sau literă) introdus.

Vezi și

Note

↑ 1 2 Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Lagarda, Antonio L.; Lapalme, Guy; Macklovitch, Elliot; Vidal, Enrique. Interacțiune umană pentru traducere automată de înaltă calitate (engleză) // Comunicări ale ACM : jurnal. - 2009. - Vol. 52 , nr. 10 . - P. 135-138 . - doi : 10.1145/1562764.1562798 . Arhivat din original pe 6 iulie 2011. Copie arhivată (link indisponibil) . Preluat la 3 august 2016. Arhivat din original la 6 iulie 2011. (nedefinit)
↑ 1 2 3 Barrachina, Sergio; Bender, Oliver; Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Khadivi, Shahram; Lagarda, Antonio L.; Ney, Hermann; Tomás, Jesús; Vidal, Enrique. Abordări statistice ale traducerii asistate de calculator // Computational Linguistics: journal. - 2009. - Vol. 25 , nr. 1 . - P. 3-28 . — doi : 10.1162/coli.2008.07-055-r2-06-29 .
↑ Foster, George; Isabelle, Pierre; Plamondon, Pierre. Traducere automată interactivă mediată de text țintă // Traducere automată : jurnal. - 1997. - Vol. 12 , nr. 1 . - P. 175-194 . - doi : 10.1023/a:1007999327580 . Arhivat din original pe 27 ianuarie 2020.
↑ Alabau, Vicent; Buck, creștin; Carl, Michael; Casacuberta, Francisco; Garcia-Martinez, Mercedes; Germann, Ulrich; Gonzalez-Rubio, Iisus; Hill, Robin; Koehn, Philipp; Leiva, Louis; Mesa-Lao, Barto; Ortiz, Daniel; Saint-Amand, Herve; Sanchis, german; Tsoukala, Chara (aprilie 2014). „CASMACAT: Un banc de lucru pentru traduceri asistate de calculator” (PDF) . Proceedings of the 14th Conference of the European Chapter of Association for Computational Linguistics . Los Angeles, California: Asociația pentru Lingvistică Computațională. pp. 25-28. Arhivat (PDF) din original pe 2015-04-13 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ Ortiz-Martinez, Daniel; Garcia-Varea, Ismael; Casacuberta, Francisco (iunie 2010). „Învățare online pentru traducerea automată statistică interactivă” (PDF) . Tehnologii limbajului uman: Conferința anuală din 2010 a capitolului nord-american al ACL . Asociația pentru Lingvistică Computațională. pp. 546-554. Arhivat (PDF) din original pe 2010-07-05 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ Martinez-Gomez, Pascual; Sanchis Trilles, german; Casacuberta, Francisco. Strategii de adaptare online pentru traducerea automată statistică în scenarii de post-editare // Pattern Recognition : journal. - Elsevier, 2012. - Septembrie ( vol. 45 ). - P. 3193-3203 . - doi : 10.1016/j.patcog.2012.01.011 .
↑ Koehn, Philipp (iunie 2010). „Activarea traducătorilor monolingvi: post-editare vs. Opțiuni” (PDF) . Tehnologii limbajului uman: Conferința anuală din 2010 a capitolului nord-american al Asociației pentru Lingvistică Computațională (HLT/NAACL) . Los Angeles, California: Asociația pentru Lingvistică Computațională. pp. 537-545. Arhivat (PDF) din original pe 2017-08-10 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ Sanchis-Trilles, Germán; Ortiz-Martinez, Daniel; Civera, Jorge; Casacuberta, Francisco; Vidal, Enrique; Hoang, Hieu (octombrie 2008). „Îmbunătățirea traducerii automate interactive prin acțiunile mouse-ului” (PDF) . Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing (EMNLP) . Honolulu, Hawaii: Asociația pentru Lingvistică Computațională. pp. 485-494. Arhivat (PDF) din original pe 2010-07-05 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ González-Rubio, Jesús; Ortiz-Martinez, Daniel; Casacuberta, Francisco (iulie 2010). „Echilibrarea efortului utilizatorului și a erorilor de traducere în traducerea automată interactivă prin măsuri de încredere” (PDF) . Proceedings of the ACL 2010 Conference Short Papers (ACL) . Uppsala, Suedia: Asociația pentru Lingvistică Computațională. pp. 173-177. Arhivat (PDF) din original pe 2011-09-30 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ Underwood, Nancy; Mesa-Lao, Bartolomé; García-Martínez, Mercedes; Carl, Michael; Alabau, Vicent; González-Rubio, Jesús; Leiva, Louis; Sanchis-Trilles, german; Ortiz-Martinez, Daniel; Casacuberta, Francisco (mai 2014). „Evaluarea efectelor interactivității într-un banc de lucru post-editare” (PDF) . Proceedings of the 29 edition of Language Resources and Evaluation Conference (LREC) . Reykjavik, Islanda. pp. 553-559. Arhivat (PDF) din original pe 2016-03-04 . Extras 2016-08-03 . Parametrul depreciat folosit |deadlink=( ajutor )
↑ Ortiz-Martinez, Daniel; González-Rubio, Jesús; Alabau, Vicent; Sanchis-Trilles, german; Casacuberta, Francisco. Integrarea învățării online și active într-un banc de lucru de traducere asistată de computer // Noi direcții în cercetarea procesului de traducere empirică : explorarea CRITT TPR-DB . — Springer, 2015. - P. 54-73.
↑ Alabau, Vicent; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Mesa-Lao, Bartolomé; Ortiz-Martinez, Daniel; González-Rubio, Jesús; Sanchis-Trilles, german; Schaeffer, Moritz. Învățarea post-editării avansate // Noi direcții în cercetarea procesului de traducere empirică : explorarea CRITT TPR-DB . — Springer, 2015. - P. 95-111.