Sistemul Leipzig de reguli de glosare

Regulile de glosare Leipzig sunt un set de reguli de glosare ( notație pomorfemică )  propuse pentru utilizare unificată atunci când se prezintă exemple de limbă în lucrări lingvistice . Include atât regulile actuale pentru proiectarea gloselor interliniare , cât și o listă de abrevieri recomandate (semne gramaticale, „etichete”) utilizate pentru a indica categoriile gramaticale .

Regulile de glosare Leipzig au fost dezvoltate în comun de Departamentul de Lingvistică al Institutului Max Planck pentru Antropologie Evolutivă și Departamentul de Lingvistică de la Universitatea din Leipzig la mijlocul anilor 2000. Acestea au fost create pe fundalul absenței oricărui sistem unificat în cadrul comunității lingvistice științifice și sunt un instrument la care poate recurge un lingvist atunci când se confruntă cu nevoia de a glosa un text. Întrucât până la acest moment s-au format deja în lingvistică unele acorduri private cu privire la anumite aspecte ale glosării, sarcina principală a acestor reguli este de a indica în mod clar convențiile cele mai utilizate pe scară largă.

Mai târziu, la începutul anilor 2010, Martin Haspelmat a propus utilizarea unui singur șablon de design pentru lucrările lingvistice pentru a depăși disparitatea în cerințele de proiectare care există în diferite reviste și edituri [1] . Regulile pe care le-a dezvoltat ( ing.  The Generic Style Rules for Linguistics ) au fost, în special, acceptate în editura lingvistică Language Science Press , care aderă la ideologia accesului deschis [2] .

Utilizare

Glosarea morfemică interliniară este utilizată pentru a transmite informații despre semnificația și proprietățile gramaticale ale cuvintelor individuale sau ale părților lor. În funcție de sarcina cu care se confruntă autorul care recurge la glosare și de nivelul așteptat de pregătire a cititorului, pot fi utilizate diferite grade de detaliere a luciului. Aceste reguli permit grade diferite de flexibilitate în utilizarea lor și, în unele cazuri, oferă alternative pentru aceeași sarcină. Principala utilizare a regulilor, sugerată de autorii proiectului, este explicarea exemplelor date în publicațiile științifice.

Deoarece regulile oferă doar instrumente de transmitere a informațiilor despre morfeme, ele pot să nu fie suficiente atunci când se marchează corpuri de text (de exemplu, atunci când este necesar să se marcheze elemente în text care depășesc nivelul de morfologie, cum ar fi cuvinte sau fraze) .

De asemenea, trebuie remarcat faptul că adesea pot exista mai multe abordări ale analizei structurilor morfologice dintr-o limbă. În acest sens, regulile nu propun să adere la una sau alta abordare, ci doar oferă posibile opțiuni pentru desemnarea elementelor descrise. Mai mult decât atât, o analiză morfologică cu drepturi depline se limitează rareori doar la glosare, așa că nu uitați că utilizarea ei nu poate înlocui analiza structurii morfologice, ci servește doar la furnizarea cititorului de informații semnificative despre structura textului, în plus față de traducerea sa literară.

Când cităm texte glosate din surse externe, trebuie avut în vedere că glosele nu sunt de fapt date lingvistice, ci sunt o metodă de analiză a datelor lingvistice. În consecință, când citează un exemplu din lucrări publicate anterior, autorul poate schimba modul de glosare în conformitate cu propria terminologie, propriul stil sau când folosește alte metode de analiză.

Prezentarea generală a exemplelor

Standardul de prezentare în lucrările lingvistice moderne este de a da un exemplu de limbă în trei „straturi” (linii):

În funcție de sarcina autorului, pot exista mai multe straturi (de exemplu, ortografie și transcriere separat sau două tipuri de transcriere; traducere idiomatică și literală separat etc.). Stratul de luciu nu poate fi dat pentru limbile cunoscute pe scară largă (de exemplu, principalele limbi din Europa de Vest, limbile slave în lucrările slavone etc.).

Metalimbajul pentru traducerea semnificațiilor lexicale (în linia de glosare) și traducerea întregii fraze este, de regulă, metalimbajul lucrării în sine. Semnele gramaticale (etichetele) sunt de obicei date cu litere latine, deoarece sunt abrevieri ale cuvintelor latine (mai puțin frecvente, engleză).

Exemplele sunt de obicei numerotate. Dacă lucrarea conține exemple din mai multe limbi, limba este indicată înaintea exemplului. În același timp, spre deosebire de limba engleză, în limba rusă numele limbii nu este scris cu majuscule (de exemplu, limba Dirbal , dar nu limba Dirbal ).

Reguli pentru notarea morfemului

Regula 1: Alinierea cuvintelor

Glosurile interliniare pentru fiecare cuvânt individual al limbii analizate sunt aliniate la marginea din stânga a acestui cuvânt (de obicei folosind tab -uri ). De exemplu:

(unu) indoneziană
Mereka di Jakarta sekarang .
ei în Jakarta acum
— Acum sunt în Jakarta.

Regula 2: Potrivirea pomorfemelor

Morfemele distincte explicit sunt separate între ele prin cratime atât în ​​textul analizat, cât și în glosele corespunzătoare. Numărul de cratime din textul analizat și din glose trebuie să se potrivească. De exemplu:

(2) Lezginsky
Gila abur-un ferma hamishaluǧ guna amuq'-da-č.
acum ei-OBL-GEN fermă mereu in spate stai-FUT-NEG
— Acum ferma lor nu va fi lăsată în urmă tot timpul.

Deoarece delimitatoarele ( cratime ) și alinierea verticală conferă textului un aspect grafic nenatural, autorul poate adăuga opțional o linie suplimentară la început care conține text brut sau să se refere la Regula 4 (în special 4C).

Limitele cliticilor sunt indicate printr-un semn „egal” atât în ​​textul sursă, cât și în glose.

(3) Groenlandeză de vest
palasi=lu niuirtur=lu
preot=si proprietar_magazin=și
„atât un preot, cât și un proprietar de magazin”

Segmentele epentetice situate pe granițele morfemului trebuie atașate la morfemul precedent sau ulterior. Alegerea morfemului de care este atașat un segment poate fi determinată prin diverse metode greu de generalizat, așa că regulile nu oferă îndrumări în această privință.

Regula 2A (versiunea extinsă)

Dacă elementele sunt înrudite morfologic, dar sunt distinse într-un cuvânt separat pe o bază prozodică sau fonologică, o combinație de spațiu și cratima poate fi folosită ca separator (dar numai în limba sursă, nu în interiorul glosei).

(patru) Chinsky
a-nii-laay
3SG-râsete-FUT
„el/ea va râde”

Regula 3: Etichetele categoriilor gramaticale

Morfemele care exprimă sensul gramatical sunt transmise în principal prin mărci ale categoriilor gramaticale corespunzătoare sub formă de abrevieri tastate cu majuscule (cel mai adesea majuscule ).

Desigur, în unele cazuri poate fi necesar să se abată de la abrevierile standard, de exemplu, dacă o anumită categorie are o frecvență ridicată într-o anumită limbă, atunci va fi mai convenabil să se folosească o abreviere mai scurtă, de exemplu, CPL ( în loc de COMPL) pentru a desemna un complex , PF (în loc de PRF) pentru a desemna perfectul etc. Dacă o categorie are o frecvență foarte scăzută în limbă, atunci poate fi optim să nu-i abreviezi deloc denumirea.

În multe cazuri, utilizarea atât a mărcilor gramaticale, cât și a cuvintelor din limba intermediară este acceptabilă. Astfel, oricare dintre cele două variante de glosare a propoziției (5) poate fi aleasă, în funcție de scopul glosării.

(5) Rusă
Noi Cu Marco merge bus-ohm în Peredelkino.
1PL COM Marco du-te-PST-PL autobuz-INS TOATE Peredelkino
noi Cu Marco du-te-PST-PL prin autobuz în Peredelkino
— Eu și Marco am mers la Peredelkino cu autobuzul.

Regula 4: Potrivirea unu-la-mulți

Atunci când un singur element al limbajului sursă corespunde mai multor elemente ale limbajului intermediar (glose lexicale sau etichete gramaticale), aceste elemente sunt separate prin puncte. De exemplu:

(6) Deutsch
unser-n Vater-n
nostru-DAT.PL tată.PL-DAT.PL
„pentru părinții noștri”

Determinarea ordinii elementelor într-un limbaj intermediar poate fi determinată într-o varietate de moduri care sunt greu de generalizat, astfel încât regulile nu oferă îndrumări în acest sens.

Există diverse motive pentru care există o corespondență unu-la-mulți între elementele limbajului sursă și elementele de gloss. Separarea elementelor cu un punct este utilizată indiferent de aceste motive. Dacă mai este nevoie să identifice (separate) cauze diferite, atunci ar trebui să se facă referire la regulile 4A-4E.

Regula 4A (îmbunătățită)

Dacă un element al limbajului sursă nu poate fi împărțit în componente nici formal, nici semantic, dar nu există un echivalent în limbajul intermediar exprimat într-un singur cuvânt, atunci se poate folosi un caracter de subliniere în locul punctului.

(7) turc
çık-mak
go_out-INF
'du-te afara'
Regula 4B (versiunea extinsă)

Dacă elementul de limba sursă nu poate fi separat în mod formal în constituenții săi, dar transmite două sau mai multe semnificații sau caracteristici gramaticale distincte, poate fi folosit un punct și virgulă. De exemplu:

(opt) limba franceza
aux chevaux
la;ART;PL cal;PL
"la cai"
Regula 4C (versiunea extinsă)

Dacă un element de limba sursă poate fi separat atât formal, cât și semantic, dar autorul nu dorește să arate diviziunea formală (pentru că nu este esențial și/sau pentru a păstra integritatea textului), se pot folosi două puncte. De exemplu:

(9) Hitit
n=an apedani mehuni essandu.
CONN=al lui este:DAT;SG ora:DAT;SG au: ei: vor
— O vor sărbători în acest moment.
Regula 4D (versiunea extinsă)

Dacă o trăsătură gramaticală în limba sursă este exprimată printr-o modificare morfologică ( ablaut , churn , schimbare de ton etc.), o bară oblică inversă este folosită pentru a separa eticheta categoriei corespunzătoare de restul luciului.

(zece) Rwanda
mú-kòra
SBJV\1PL-lucrare
"sa lucram" (cf. mù-kòrà indicativ )
Regula 4E (îmbunătățită)

Dacă afixele numerelor personale sunt prezentate în limba sursă care exprimă simultan argumentele de tip agent și pacient ale verbului tranzitiv, simbolul „>” poate fi folosit în glosă pentru a indica faptul că argumentul de tip agent se află pe stânga, iar argumentul de tip pacient este în dreapta.

(unsprezece) Chamintyung
nanggayan guny-bi-yarluga?
OMS 2DU>3SG-FUT-stab
— Pe cine vreți să înjunghiați?

Regula 5: Etichete pentru categoriile de persoane și numere

Indicatorii de persoană și numărul nu sunt despărțiți de un punct dacă sunt în ordine secvențială. De exemplu:

(12) Italiană
and-iamo
go-PRS.1PL (nu: go-PRS.1.PL)
'noi mergem'
Regula 5A (îmbunătățită)

În unele limbi, indicatorii de număr și gen sunt foarte des întâlniți, mai ales în combinație cu indicarea unei persoane. În astfel de cazuri, unii autori preferă să folosească abrevieri cu litere mici fără a le separa cu un punct. Când utilizați această opțiune, luciul va arăta ca pe a doua linie din exemplul (13).

(13) Belhare
ne-e a-khim-chi n-yuNNa
DEM-LOC 1SG.POSS-casa-PL 3NSG-fi.NPST
DEM-LOC 1sPOSS-casa-PL 3ns-be.NPST
— Aici sunt casele mele.

Regula 6: Componente neexprimate

Dacă glosa conține un element care nu corespunde unui element explicit al textului sursă ( morfem „null” ), atunci este inclus între paranteze drepte. Alternativ, în locul unui element neexprimat, semnul „Ø” este adăugat textului sursă, care este separat printr-o cratimă, ca orice element explicit.

(paisprezece) latin
puer sau puer-Ø
băiat[NOM.SG] băiat-NOM.SG
'băiat' 'băiat'

Regula 7: Categoriile inerente

Categoriile inerente, non-explicite, cum ar fi genul în unele limbi, pot fi redate atunci când sunt glosate, dar cu elementul corespunzător cuprins între paranteze. De exemplu:

(cincisprezece) Gunzibsky
ož-di-g xxe m-uq'e-r
băiat-OBL-AD lemn (G4) G4-bend-pret
— Din cauza băiatului, copacul s-a aplecat.
(G4 = al 4-lea gen, AD = adesiv , PRET = preterit )

Regula 8: Morfeme cu două elemente

Elementele gramaticale sau lexicale cu două componente care sunt tratate ca unități morfologice separate (de exemplu, tulpini cu două componente, cum ar fi na-xʔuhall „auzi” în Lakota ) pot fi redate în două moduri diferite:

(i) Prin simpla repetare a luciului:

(16) Lakota
na-wicha-wa-xʔui
auzi-3PL.UND-1SG.ACT-auzi
— Îi aud.

(ii) Una dintre cele două părți poate fi transmisă cu o marcă specială, de ex. STEM

(17) Lakota
na-wicha-wa-xʔu
auzi-3PL.UND-1SG.ACT-STEM
— Îi aud.

Circumfixele , care sunt „afixe ​​cu două componente”, pot fi transmise folosind aceleași reguli, de exemplu:

(optsprezece) Deutsch
ge-seh-en sau ge-seh-en
ptcp-vezi-ptcp ptcp-vezi-circ
'văzut' 'văzut'

Regula 9: Infixe

Ambele elemente infixate din textul sursă și elementele lor lucioase corespunzătoare sunt incluse între paranteze unghiulare.

(19) tagalog
b<um>ili (baza: bili )
<ACTFOC>cumpărați
'Cumpără'
(douăzeci) latin
reli<n>qu-ere (tulpina: reliqu- )
pleca<PRS>-INF
'părăsi'

Dacă nu este dificil să se determine dacă infixul este stângaci, ca în (19), sau dreptaci, ca în (20), aceasta determină poziția luciului care indică infixul în raport cu luciul care indică tulpina lexicală. Dacă infixul nu este în mod explicit stângaci sau dreptaci, ar trebui elaborat un principiu separat prin care vor fi ordonate elementele din luciu.

Regula 10: Reduplicare

Reduplicarea este trecută în același mod ca afixul , dar semnul tilde este folosit pentru a atașa elementul care se repetă la tulpină , mai degrabă decât o cratimă.

(21) ebraică
yerak~rak-im
verde~ATT-M.PL
'verzui'

Abrevieri ale etichetelor gramaticale

  • Lista abrevierilor utilizate în glosare

Literatură

  1. Lehmann, C. Directions for interlinear morphemic translations. Folia Linguistica No. 16. 1982. S. 199-224.
  2. Croft, W. Tipologie și universale. a 2-a ed. Cambridge: Cambridge University Press. 2003. S. xix-xxv.
  3. Plungyan V.A. Morfologie generală: Introducere în probleme. M. 2012. - S. 330-333

Note

  1. Regulile de stil generic pentru lingvistică . Preluat la 28 august 2018. Arhivat din original la 10 aprilie 2018.
  2. Șabloane și instrumente . Preluat la 28 august 2018. Arhivat din original la 29 august 2018.

Link -uri