În tipografia digitală , caracterele combinabile sunt caractere concepute pentru a modifica alte caractere. Cele mai comune caractere combinabile în latină sunt diacritice combinabile (inclusiv accente combinabile ).
Unicode conține, de asemenea, multe caractere precompuse, astfel încât în multe cazuri pot fi utilizate atât diacritice combinabile, cât și caractere precompuse la alegerea utilizatorului sau a aplicației. Acest lucru duce la cerința de a efectua normalizarea Unicode înainte de a compara două șiruri de caractere Unicode și de a proiecta cu atenție convertizoarele de codificare pentru a mapa corect toate reprezentările de caractere Unicode valide la codificarea moștenită pentru a evita pierderea datelor.
În Unicode, blocul principal pentru diacritice combinabile ale limbilor europene și alfabetului fonetic internațional este U+0300…U+036F . Combinarea semnelor diacritice apar și în multe alte blocuri Unicode. În Unicode, semnele diacritice sunt întotdeauna plasate după caracterul de bază (spre deosebire de unele seturi mai vechi de caractere combinabile, cum ar fi ANSEL ), care permite adăugarea mai multor diacritice la un singur caracter, deși din 2010 puține aplicații acceptă afișarea corectă a acestor combinații.
Caracterele combinate sunt, de asemenea, folosite pentru a crea ceea ce este cunoscut sub numele de „text Zalgo” - text care pare deranjat din cauza folosirii excesive a semnelor diacritice. Acest lucru face ca textul să se extindă pe verticală, suprapunând alt text [1] .
ExempluP̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͌͗̏̔̓̓̐͗̏̔̓̓̐̈̈͌̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿y̿y̎͒̌̓̎̊͋͛ẙ̅̃y͛̄̽̒̋̋y͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̔̑̎̾̽̔y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̔͋̄̎͑y̔͋̄̎͑y̿͋̍̈̎̑̿̈y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̅̿̌̌̆̆y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̔͋̄̎͑y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y͗̋̎̓̐̆̾̈y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̿͋̍̈̎̑̿̈y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀ R
Unicode conține următoarele blocuri special pentru semnele diacritice combinabile:
Una dintre caracteristicile unui caracter în Unicode este clasa de combinabilitate canonică, care acceptă doar valori numerice [2] .
Sens | Titlu complet în engleză | traducere rusă | Descriere |
---|---|---|---|
0 | Not_Reordoned | Nedeterminat | Semne necombinabile și de încadrare; de asemenea multe semne pentru vocale și consoane, chiar dacă sunt combinabile |
unu | acoperire | semn de suprapunere | Caractere suprapuse pe o literă de bază sau un simbol |
7 | Nukta | Nuqta | Nukta - un semn în sistemele de scriere derivate din Brahmi |
opt | Kana_Voicing | Semne kana vocale | Semne vocale în kana - dakuten și handakuten |
9 | Virama | Virama | Virama este un semn în sistemele de scriere derivate din Brahmi |
10-199 | Ccc10—Ccc199 | Clasele de combinabilitate canonică 10-199 | Clasele cu poziții fixe |
200 | Atașat_Dedesubt_Stânga | Semn de contact din stânga jos | |
202 | Atașat mai jos | Semnul de contact de mai jos | |
204 | — | ||
208 | — | ||
210 | — | ||
212 | — | ||
214 | Atașat_Deasupra | Semn de contact de sus | |
216 | Atașat_Sus_Dreapta | Semn de contact din dreapta sus | |
218 | Dedesubt_stânga | Semnează stânga jos | |
220 | De mai jos | semnează de jos | |
222 | Dedesubt_Dreapta | Semn dreapta jos | |
224 | Stânga | Semnează în stânga | |
226 | Dreapta | Semnul corect | |
228 | Deasupra_Stânga | Semnul din stânga sus | |
230 | De mai sus | semn de sus | |
232 | Deasupra_Dreapta | Semn dreapta sus | |
233 | Double_Below | semn dublu de mai jos | |
234 | Dublu_Deasupra | semn dublu deasupra | |
240 | Iota_Subscript | Iota interliniară | Numai indicele grecesc iota |