Separarea cuvintelor este acțiunea și rezultatul separării reciproce a reprezentărilor scrise ale cuvintelor .
Limbile semitice timpurii , care nu aveau semne pentru sunetele vocale, foloseau divizarea cuvintelor; limbile care aveau aceste semne (în principal greacă și latină ) au pierdut separarea cuvintelor, revenind la ea mult mai târziu. [unu]
În limbile moderne, semnele de punctuație utilizate în alte scopuri (virgulă, punct și virgulă) pot avea efectul suplimentar de separare a cuvintelor succesive. În funcție de limbă și epocă, separarea cuvintelor poate fi realizată prin caractere speciale, convenții sau spații (spații).
Fără separare | Un script bazat pe alfabet fără separare de cuvinte este uneori numit scriptura continua . Era tipic în egipteana antică , greacă veche , latină postclasică (după o perioadă de punctuație, 200-600-800 d.Hr.), chineză și japoneză . |
---|---|
spatii | Cele mai multe limbi moderne (folosind latină și chirilică ), coreeană . |
linii verticale | Hieroglife anatoliene antice adesea (dar nu întotdeauna). În ebraica biblică, o linie verticală de stupine însemna o scurtă pauză. |
Paranteze diagonale (barele oblice) și puncte | Se menționează că fenicianul folosea inițial barele oblice și punctele pentru a marca granițele cuvintelor. Se mai spune că ebraica și aramaica au împrumutat slash and dot, iar aramaica a folosit și un spațiu. |
Linii/puncte verticale | Inscripțiile etiopiene foloseau linii verticale, reprezentate pe hârtie prin două puncte asemănătoare colonului (în Unicode , „ Spațiul etiopic ”, în U+1361: ፡). Acest simbol de două puncte se găsește și în limba turcă antică . |
Interpunkt | Scrierea clasică latină folosea un interpunct , un punct mic (de exemplu, ALEA IACTA EST) pentru a separa cuvintele, care a continuat până în secolul al II-lea î.Hr. n. e. [2] |
Diverse forme de litere | Deoarece scrierea ebraică și arabă nu avea vocale, cel mai important lucru aici este recunoașterea limitelor cuvintelor. În timp ce ebraica și arabă foloseau spații între cuvinte, unele litere aveau și forme diferite în funcție de poziția lor.
Cele cinci litere ebraice iau o formă diferită atunci când se află la sfârșitul unui cuvânt. Caracterele arabe pot avea până la 4 forme diferite, în funcție de faptul că vin înainte sau după altă literă din același cuvânt. |
spațiu vertical | O variantă a grafiei arabe ( poshibe ) folosește un spațiu vertical pentru a separa cuvintele. Începutul fiecărui cuvânt este scris mult deasupra liniei principale, în timp ce sfârșitul său este scris mai jos, aproape de linia principală. Linia de text se termină într-un mod care arată ca un dinte de ferăstrău. Se găsește adesea în persană , uigură , pașto și urdu . |
Se crede că irlandeza a fost prima limbă care a folosit în mod sistematic spațiile pentru a delimita cuvintele din alfabetul latin, între aproximativ 600 și 800 î.Hr. n. e. Deoarece irlandeza aparține unei ramuri diferite a familiei de limbi indo-europene decât latină, citirea latinei este mai dificilă pentru vorbitorii de irlandeză decât pentru vorbitorii de spaniolă sau italiană (rămășițe ale latinei care sunt încă aproape de ea). Astfel, limba irlandeză a făcut un pas mare spre simplificarea procesului de citire în latină.