Diacritice

Semnele diacritice ( alte grecești διακριτικός  - „care servesc pentru a distinge”, de la alte grecești κριτικός  - „capabili de a distinge”):

Uneori se cere suplimentar ca semnele diacritice să fie mai mici decât literele.

Sistemul de diacritice a oricărei scrieri sau text se mai numește și diacritice .

În unele cazuri, două, trei sau chiar patru semne diacritice pot fi folosite simultan cu o literă: , ṩ , , ᾧ .

Vocalizările în sistemele de scriere consonantică (de exemplu, în ebraică , arabă și siriacă ), care sunt similare ca aspect cu semnele diacritice, sunt mai degrabă un tip special de litere în sens.

Se recurge la diacritice dacă literele alfabetului nu sunt suficiente pentru a transmite sunetele vorbirii sau pentru a distinge între semnificații. Principala alternativă la semnele diacritice în discriminarea sunetului sunt combinațiile de două ( digrafe ), trei ( trigrafe ) sau mai multe litere pentru a desemna un sunet. De exemplu, sunetul [ ʃ ] este transmis prin litera š într-un număr de limbi, sau prin digraful ch în franceză, portugheză sau sh în engleză sau prin trigraful sch în germană. Diacriticele sunt folosite atât cu vocalele, cât și cu consoanele. Principalul dezavantaj al semnelor diacritice este dezordinea scrisului cu detalii mici, dar importante, a căror omisiune poate duce la erori grave. Există limbi în care semnele diacritice nu sunt la fel de comune ( rusă ) sau practic nu sunt folosite ( engleză ). În unele cazuri, există tendința ca literele diacritice să fie înlocuite cu digrafe (germană: öoe în text tipărit și informatizare, totuși, odată cu dezvoltarea suportului umlaut , acest fenomen practic a dispărut).

Istorie

Cele mai vechi semne diacritice au fost probabil accentul grecesc antic și semnele de aspirație, a căror invenție este atribuită lui Aristofan din Bizanț .

Diacritiile sunt utilizate pe scară largă în limbile care folosesc alfabetul latin . Acest lucru se datorează faptului că în latină clasică nu existau sunete de șuierat, vocale nazale, consoane palatalizate (înmuiate), care au fost sau dezvoltate în alte limbi, în special în cele neînrudite. Deci, dacă în italiană este posibil să transferați sibilante pur pozițional (de exemplu, în cuvântul città "citta"  - "oraș", unde c + i înseamnă automat un sunet sibilant), atunci în alte limbi care nu sunt legate de latină , este imposibil. Alfabetele cehă , slovacă , turcă , română , poloneză , letonă , lituaniană , vietnameză sunt cele mai încărcate cu semne diacritice distinctive . În portugheză și franceză , vocalele (ê, è, ë, ï, ã) sunt supuse unei puternice diacritizări, atât sonore, cât și semantice, și pur etimologice: île < lat.  insula „insula”. Limbile romanice au, de asemenea, o consoană specială diacritizată ç , în spaniolă - litera ñ , rezultată din scrierea superscriptului „cu două etaje” a două litere nn în cuvinte latine precum annum > anno > año „an”.

Clasificare

Diacriticele pot fi clasificate în diferite moduri.

  1. După locul scrierii: superscript, indice, inline.
  2. Conform metodei de desen: atașat liber la personajul principal sau necesită o schimbare a formei acestuia.
  3. După semnificația fonetic-ortografică (clasificarea este incompletă, iar categoriile nu se exclud reciproc):
    • semne care au un sens fonetic (care afectează pronunția):
      • semne care dau literei o nouă valoare sonoră, diferită de cea alfabetică obișnuită (de exemplu, cehă č , ř , ž );
      • semne care clarifică pronunția unui sunet (de exemplu, franceză é , è , ê );
      • semne care indică faptul că litera își păstrează sensul standard într-un astfel de mediu atunci când sunetul ei ar trebui să se schimbe (de exemplu, franceză ï );
      • semne prozodice (specificarea parametrilor cantitativi ai sunetului: durată, putere, înălțime etc.):
        • semne de longitudine și scurtarea vocalelor (de exemplu, greaca veche , );
        • semne de ton muzical (de exemplu , chineză ā , á , ǎ , à , a );
        • semne de accentuare (de exemplu, accent grecesc „acut”, „greu” și „îmbrăcat”: ά , , );
    • semne care au doar semnificație ortografică , dar nu afectează pronunția:
      • semne care vă permit să evitați omografia (de exemplu, în slavona bisericească există unități creative care se încadrează ale numărului „mic” și dat cădere la plural ale numărului „m âlym ”; în spaniolă si „dacă” și S í „da”) ;
      • semne care nu denotă nimic și sunt folosite conform tradiției (de exemplu, aspirație în slavona bisericească , care se scrie întotdeauna peste prima literă a cuvântului, dacă aceasta este o vocală );
    • semne de semnificație hieroglifice (considerate diacritice doar din punctul de vedere al tipografiei):
      • semne care indică o scriere prescurtată sau condiționată (de exemplu, un titlu în slavona bisericească);
      • semne care indică utilizarea literelor în alte scopuri (aceleași titluri în notația chirilică a numerelor).
  4. După statutul formal:
    • semne cu ajutorul cărora se formează litere noi ale alfabetului (în terminologia occidentală acestea sunt uneori numite modificatori, iar nu diacritice propriu-zise);
    • caractere ale căror combinații de litere nu sunt considerate a fi o singură literă (astfel de semne diacritice de obicei nu afectează ordinea de sortare alfabetică).
  5. Utilizare obligatorie:
    • semne, a căror absență face ortografia textului incorectă și, uneori, imposibil de citit,
    • semne folosite numai în împrejurări speciale: în cărți pentru predarea inițială a lecturii, în texte sacre, în cuvinte rare cu lectură ambiguă etc.

Dacă este necesar (de exemplu, în cazul restricțiilor tehnice), diacriticul poate fi omis, uneori cu inserarea sau înlocuirea literelor cuvântului.

Diacriticele care arată la fel pot avea semnificații, nume și statut diferite în limbi și sisteme de scriere diferite.

Atribuirea unuia sau altui element al sistemului grafic la semnele diacritice este în mare măsură condiționată. Deci, în scrierea rusă modernă , se pot găsi „semne diacritice” de diverse indiscutabilități (de la absolut la aproape zero):

Diacritice de bază

Cometariu. Nu există nume rusești bine stabilite pentru majoritatea diacriticelor. Concurează în prezent:

O complicație suplimentară a situației este faptul că două caractere diferite într-o limbă în alta se pot dovedi a fi variante de font interschimbabile.

Descriere, cod Exemplu Utilizări posibile

Superscripturi necombinate

trăsătură în formă de / peste litera
U+0301
A 1. Accentul acut  - un semn diacritic peste o literă folosită în greacă, romanică, slavă și multe altele. alte limbi. Pentru a desemna exact „stresul acut” ca fenomen în alte limbi , mai mulți termeni pot fi găsiți simultan în rusă, de exemplu, 1) acută (< lat.  acutus  - „ascuțit”), 2) oxia (din altă greacă ὀξεῖα), 3) aksantegü (din accentul francez  aigu  - literalmente „stres acut”).

2. În rusă, se folosește termenul „accent” („semn de accent”), care este asociat cu prezența unui singur tip de accent în limbă (creșterea tonului sunetului vocal pe care cade accentul). Folosit în literatura educațională, dicționare sau pentru a rezolva ambiguități (de exemplu, „mare”).

ń , ѓ line ( poloneză kreska ( „kreska” - line, line )) în poloneză denotă o atenuare specifică a consoanelor, iar peste ó  - pronunție ca [u]; același sens de înmuiere este folosit în sorabă, croată, macedoneană și în alte limbi
A în cehă, slovacă și maghiară - o măsură a lungimii vocalelor
A în transcrierea pinyin chineză deasupra unei vocale denotă un ton în creștere
cursă în formă de \ peste litera
U+0300
A accent greu [comm. 1] : altul grecesc. βᾰρεῖα , c.-sl. varia , lat.  gravis ( gravis ), fr.  accent grave , engl.  mormânt ; folosit în greacă (ortografia politonică), romantică (în primul rând franceză), slavă de sud și multe altele. alte limbi
A în transcrierea pinyin chineză deasupra unei vocale denotă un ton în cădere
două puncte superscript
U+0308
ë, ï, ü semn de citire separată a combinațiilor de litere: gr. diereza sau dialytika, Gr. și fr.  trema ( trema ); folosit în greacă, romantică și în alte limbi (uneori chiar și în engleză)
ä, ö, ü umlaut  - un semn al limbajului german și al altor scripturi germanice, indicând o pronunție schimbată („înmuiată”) a unor vocale; împrumutat și de alte limbi (de exemplu finlandeză, estonă, maghiară, turcă și slovacă)
yo colonul face parte din litera rusă (și belarusă) „ё”
ї colonul face parte din litera ucraineană „ї” [yi]
ї , ѷ în slavona bisericească kendema , adică două puncte (sau două linii // sau \\, care era echivalent), sunt plasate peste litera i și izhitsa ( ѵ ) în cazul în care sunt citite ca [și] și nu au alte superscripte pe semnele lor (accent sau aspirație)
ӥ în transcrierea fonetică a textului rusesc: schimbarea vocală cauzată de poziţia dintre consoanele moi
un capac peste o literă
(în formă de ^: U+0302,
rotund: U+0311,
semn SL al moliciune: U+0484,
peste o pereche de litere: U+0361)
â, ê, û... stres îmbrăcat [comm. 2] : altul grecesc. περισπασμός, c.-sl. camera , lat.  circumflexus ( circumflex ), fr.  accent circonflexe , engl.  circumflex ; folosit în greacă (ortografia politonică), romanică (în primul rând în franceză), sârbă, C.-SL. și multe altele. alte limbi; în limbile clasice, capacul este de obicei rotund sau chiar (în greacă) în formă de tilde (vezi mai jos), în franceză, uneori în sârbă - ascuțit.
A în transliterarea latină a persanei, denotă o lungă ɑ guturală
ĉ , ĝ , ĥ , ĵ , ŝ în esperanto , caracterul superscript ^ este numit oficial „circumflex” ( Esp. „circumflekso”), informal - „pălărie” ( Esp. „ĉapelo”); modifică citirea consoanelor nelimitate corespunzătoare astfel încât acestea să fie citite ca rusești ch , dzh , x , zh și sh (aproximativ)
î în română, un capac ascuțit peste â și î înseamnă că sunt citite ca [s]
ê, ŝ în unele sisteme de transliterare latină a alfabetului chirilic , litera „e” poate fi transmisă prin ê ,  iar litera „u” poate fi transmisă prin ș
f͡j în unele sisteme de transcriere, un capac rotund deasupra unui grup de litere indică pronunția continuă a acestora ( africată )
în slavona bisericească veche, un capac rotund deasupra unei consoane (uneori ușor deplasat la dreapta) înseamnă moliciunea acesteia
c, o, u În turcă, un capac ( turc . düzeltme işareti , „semn de corectare”) peste o vocală în cuvintele de împrumut arabă și persană denotă o vocală lungă sau moliciune a sunetului g sau k precedent . De asemenea, poate desemna moliciunea l -ului precedent în toponime și antroponime. [2]
„pasăre” deasupra literei
U+030C
ž , ě cârlig ( haček , ceh. háček ) - un semn al scrierii cehe, care marchează șuieratul și consoanele moi, precum și înmoaie foarte mult pronunția literei ě (corespunzând de obicei vechiului yat slav ); peste unele litere, pentru frumusețe, poate arăta ca un apostrof aproape blocat : Ľ , ď , etc .; împrumutat în alte scripturi (în croată a fost folosit în ambele sensuri); folosit în unele sisteme de transliterare latină pentru alfabetul rus și alte chirilice. În argoul informatic englez din anii 1980, numele caron de origine neclară a apărut pentru acest semn ( caret + macron ?, carom + on ?, lat.  corona ?), care s-a răspândit ulterior în alte limbi și documente oficiale (cum ar fi Unicode). standard).
z denotă sunetul zh în unele limbi finno-ugrice, baltice și slave
s denotă sunetul sh în unele limbi finno-ugrice, baltice și slave
c denotă sunetul h în unele limbi finno-ugrice, baltice și slave
ǎ în transcrierea pinyin chineză deasupra unei vocale denotă un ton descendent-crescător
ѯ cârligul face parte din litera slavonă veche „Ѯ” (Xi).
// deasupra literei
U+030B
ő , ű „umlaut maghiar”: ő și ű înseamnă versiuni lungi ale sunetelor exprimate prin literele ö și ü
ѵ̋ în slavonă bisericească: varianta fontului lui ѵ̈
\\ deasupra literei
U+030F
și în sârbă: stres scurt în cădere
ѷ în slavona bisericească: varianta de font a stilului ѵ̈ (pentru Izhitsa cea mai comună, dar ї a fost desenat mai des cu puncte sau linii verticale)
cerc în indicele
U+030A
e în unele limbi scandinave, å denotă un [a] lung care a devenit [o]; majuscule Å  - desemnarea angstroms
ů în cehă, cu ajutorul unui cerc ( ceh. kroužek ), ů denotă un lung [u:], derivat din diftongul uo
punct superscript
U+0307
eu , j ( titlu englezesc  ) face parte din literele mici i și j ale majorității limbilor cu latină și unele cu scriere chirilică (când se adaugă orice alt superscript, punctul este de obicei eliminat); în unele limbi turcești (de exemplu, în turcă) litera i se distinge cu un punct (în turcă se citește ca [i]) și fără un punct (se citește ca [s]), iar această distincție este păstrat și pentru litere mari
z consoane șuierătoare în vechea scriere cehă, litera ż în poloneză actuală
e în lituaniană
Transliterarea latină a sanscritei (prin ṁ în diferite sisteme, pot fi descrise atât anunasika , cât și anusvara , dar aceasta din urmă poate fi și ṅ)
ḃ, ḋ, ḟ, ṁ, ṗ, ṫ folosit anterior în irlandeză și în alte limbi goidelice, un punct peste o consoană denota leniție . În ortografia modernă, leniția este indicată prin adăugarea literei Hh .
punct la stânga deasupra literei în transcrierea fonetică a unui text rusesc: schimbarea vocală cauzată de poziţia după o consoană moale
punct în dreapta deasupra literei
U+0358
A în transcrierea fonetică a textului rusesc: schimbarea vocală cauzată de poziţia înaintea unei consoane moale
tilde peste
U+0303
(greacă
U+0342)
A în unele sisteme de transcriere, tilda (derivată din superscriptele n și m ) peste vocale semnifică pronunția lor nazală; în acest sens este folosit și în portugheză
ñ în spaniolă ñ  - moale [n]
õ reprezintă sunetul ы în estonă
în ortografia greacă politonică, tilde este o versiune de font a unui capac rotund (vezi mai sus despre „stresul îmbrăcat”)
bar peste litera
U+0304
A sensul principal (care provine din greaca veche și latină) este o indicație a lungimii vocalelor (și a consoanelor silabice); uneori este folosit denumirea grecească macron
A în transcrierea pinyin chineză deasupra unei vocale denotă un ton plat
Superscript în formă de
U U+0306
A sensul principal (care provine din limbile greacă și latină veche) este un indiciu al conciziei vocalelor; lat.  brevis ( brevis ), ing.  Breve
th în chirilic slav înseamnă caracterul non-silabic al vocalelor și trecerea lor la consoane; c.-sl. și rusă numele este scurt (de la sfârșitul secolului al XIX-lea este scurt și în dicționare ). Face parte din literele y , ў (utilizate în limba belarusă) și unele. etc. În scripturile chirilice moderne, este de obicei descris diferit decât în ​​greacă și latină.
ӂ în alfabetul chirilic moldovenesc al vremurilor sovietice , litera „ӂ” însemna africata [j]
ğ în turcă, ğ denotă un sunet apropiat de g belarus , iar în unele dialecte ajungând la dispariția completă
ŭ în Esperanto , accentul în formă de U, numit informal „bath” ( Esp. „kuveto”), transformă vocala u într-un sunet non-silabic apropiat de engleza w , folosit aproape exclusiv în diftongul aŭ și eŭ , de exemplu : "aŭroro" ("zori"), "Eŭropo" ("Europa")
(semn în formă
greacă: U+0314,
Cyr.: U+0485
ὡ, ῥ respirație adâncă (corespunde adesea cu h- inițial în internaționalisme): altele grecești. δᾰσεῖα , c.-sl. dasia , lat.  spiritus asper ; folosit în ortografia greacă politonică și în unele soiuri mai vechi de slavonă bisericească
)-semn
grecesc: U+0313,
Cyr.: U+0486
ὀ, ὠ aspiratie subtire: alta greceasca. πνεῦμα ψιλόν , de asemenea ψιλή, c.-sl. spirit, de asemenea psili sau apelant , lat.  spiritus lenis ; folosit în ortografia greacă politonică și în slavona bisericească (nu reprezintă nimic, este plasat deasupra vocalei inițiale a cuvintelor)
coada de cal de sus
U+0309
A Personaj vietnamez pentru unul dintre tonurile muzicale ( vietnamez dấu hỏi )
titlul
U+0483
un semn vechi și slavon bisericesc pentru indicarea ortografiei abreviate a cuvintelor și pentru notarea literală a numerelor
apostrof [comm. 3] n' în unele sisteme de transcripție fonetică: un semn de blândețe a consoanelor: dragoste = [l'ub'it'] sau [l'ub'it'], iar în unele este invers (de exemplu, în ucraineană ) - duritate (dar uneori și moliciune) .

Indice necombinate

indicele
U+0323
diverse sisteme de transcriere și transliterare (limbi semitice, limbi indiene etc.); un punct subindice poate desemna consoane silabice (ṛ, ḷ), consoane cerebrale (ḍ, ṭ, ṇ), anunasika cu anusvara etc.
indicele U+ 0326
ț șuierat și șuierat în română ( ș , ț )
cerc indice
U+0325
în unele sisteme de transcriere (de exemplu, în reconstrucția limbii indo-europene sau proto-slave), cercul de sub consoană indică caracterul său silabic
„cupă” sub mai multe litere
U+035C
t͜s în unele sisteme de transcriere fonetică, semnul ͜ sub combinația de litere înseamnă pronunția sa continuă - africativă
„pălărie” sub litera
U + 032F
în unele sisteme de transcriere fonetică: sunet non-silabic
subliniază
U+0331
A în dicționare poate denota stres
„pasăre” sub litera
U+032C
în IFA  - un semn de voce
iota semnat
U+0345
în greaca veche

Superscripte îmbinate

claxon dreapta și sus
U+031B
ơ folosit în vietnameză
un singur apostrof
U+0491
G folosit în ucraineană pentru a evidenția r-ul ploziv (spre deosebire de r-ul fricativ obișnuit adoptat în ucraineană). Dacă nu este prezent pe aspectul vizual, acesta este înlocuit cu r' sau pur şi simplu r. (În aspectul tastaturii ucrainene - dreapta Alt+r=ґ, ​​​​dreapta Alt+Shift+r=Ґ). De asemenea, folosită ca scrisoare opțională în belarusă Tarashkevitsa .

Indice continue

cedilla
U+0327
ç provine din limba spaniolă ( spaniola  zedilla [cedilla] - „mic” z „”), dar acum nu este folosit acolo; cel mai cunoscut pentru utilizarea sa în franceză ( franceză  cédille [gris]), este plasat sub c în cazul în care această literă ar trebui să fie marcată cu pronunția [s] în loc de [k]: fațade [fațadă]; este, de asemenea, folosit în alte limbi sub diferite litere și cu semnificații diferite (de exemplu, în turcă literele c, ç, s, ș denotă sunetele [j], [h], [s] și [sh] respectiv). În scrierea letonă, cu litera minusculă g , cedila se întoarce și devine superscript: ģ
c-tail
U+0328
e provine din scrierea latină medievală, unde semnul ę era un înlocuitor compact pentru ligatura æ ; de acolo a fost împrumutat de scrierea poloneză și a primit numele ogonek [ogónek] = „coada”; în poloneză, este folosit în literele vocalelor nazale ą și ę . Împrumutat din poloneză de alte limbi (în special, lituaniană), folosit cu diferite litere
coada de cal ca c sau u ҷ , ӌ a fost folosit în anii 1930 și mai târziu la crearea scripturilor chirilice pentru diferite limbi ale URSS; de obicei mergea în dreapta și în jos, dar uneori în stânga și în jos

Caractere continue inline

cursă orizontală
scurtă: U+0335,
lungă: U+0336
đ în vietnameză - litera „d”
cursă diagonală
scurtă: U+0337,
lungă: U+0338
ø în daneză, norvegiană, feroeză ø înseamnă la fel ca în germană, suedeză, islandeză ö
ł ł  - poloneză neînmuiată [l], transformându-se în non-silabă [y]; barajul este de obicei italic, dar în fonturile decorative poate fi orizontal, sub formă de tilde etc.; când scrieți de mână, în loc de baraj, puneți o tilde deasupra
cursă verticală

minuscule: U+049C,

capitala: U+049D

Ҝ Ҝ  este a 15-a literă a alfabetului chirilic azer. Indică o plozivă palatinală sonoră [ɟ ]
tilde în mijloc ɫ

Cozi de cal:

Alte semne diacritice specifice sunt folosite în IPA și în scrierea slavonă bisericească .

Pentru scrierea unor semne diacritice utilizând marcajul HTML , consultați Combinarea semnelor diacritice .

Exemple

Lituaniană

Lituanianul are 12 vocale. În plus față de literele latine standard, diacriticele sunt folosite pentru a desemna vocalele lungi (ilgoji: y, ū) și nazale (nosinė: ą, ę, į, ų - notate cu ogonek) vocale rămase din timpul când aceste litere erau pronunțate nazal, ca unele vocale în poloneza modernă. Aceste vocale modificate (cu excepția lui ė) în vorbirea colocvială modernă nu se evidențiază în niciun fel în sunet în raport cu vocalele principale și poartă, practic, o încărcătură istorică în scris.

majuscule A A E Ę Ė eu Į Y O U Ų Ū
Litere mici A A e e e i i y o u ų ū
ÎN CAZUL ÎN CARE UN A A ɛ ɛː i o u

Note

Comentarii
  1. Numele „accent tocit” este incorect.
  2. Denumirea „ stres ușor ” este incorectă.
  3. În scrierea slavonă bisericească, un apostrof nu este numit „semn de punctuație”, ci o combinație de aspirație cu stres puternic.
Surse
  1. Semne diacritice // Editura dicționar-carte de referință: [electron. ed.] / A. E. Milchin . - Ed. a 3-a, Rev. si suplimentare — M. : OLMA-Press, 2006.
  2. Reguli de ortografie turcești privind semnul de modificare Arhivat 28 ianuarie 2020 la Wayback Machine de pe site-ul web TDK

Literatură