Simbol combinat

În tipografia digitală , caracterele combinabile  sunt caractere concepute pentru a modifica alte caractere. Cele mai comune caractere combinabile în latină sunt diacritice combinabile (inclusiv accente combinabile ).

Unicode conține, de asemenea, multe caractere precompuse, astfel încât în ​​multe cazuri pot fi utilizate atât diacritice combinabile, cât și caractere precompuse la alegerea utilizatorului sau a aplicației. Acest lucru duce la cerința de a efectua normalizarea Unicode înainte de a compara două șiruri de caractere Unicode și de a proiecta cu atenție convertizoarele de codificare pentru a mapa corect toate reprezentările de caractere Unicode valide la codificarea moștenită pentru a evita pierderea datelor.

În Unicode, blocul principal pentru diacritice combinabile ale limbilor europene și alfabetului fonetic internațional este U+0300…U+036F . Combinarea semnelor diacritice apar și în multe alte blocuri Unicode. În Unicode, semnele diacritice sunt întotdeauna plasate după caracterul de bază (spre deosebire de unele seturi mai vechi de caractere combinabile, cum ar fi ANSEL ), care permite adăugarea mai multor diacritice la un singur caracter, deși din 2010 puține aplicații acceptă afișarea corectă a acestor combinații.

Text Zalgo

Caracterele combinate sunt, de asemenea, folosite pentru a crea ceea ce este cunoscut sub numele de „text Zalgo”  - text care pare deranjat din cauza folosirii excesive a semnelor diacritice. Acest lucru face ca textul să se extindă pe verticală, suprapunând alt text [1] .

Exemplu

P̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͌͗̏̔̓̓̐͗̏̔̓̓̐̈̈͌̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿y̿y̎͒̌̓̎̊͋͛ẙ̅̃y͛̄̽̒̋̋y͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̔̑̎̾̽̔y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̔͋̄̎͑y̔͋̄̎͑y̿͋̍̈̎̑̿̈y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̅̿̌̌̆̆y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̔͋̄̎͑y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y͗̋̎̓̐̆̾̈y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̿͋̍̈̎̑̿̈y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̿͋̍̈̎̑̿̈y̒̿y̾̈̀͛̈y̾̈̀͛̈y̓̽̃͒̀̆̀y̓̽̃͒̀̆̀ R

Intervalele în Unicode

Unicode conține următoarele blocuri special pentru semnele diacritice combinabile:

Clasa de combinabilitate canonică

Una dintre caracteristicile unui caracter în Unicode este clasa de combinabilitate canonică, care acceptă doar valori numerice [2] .

Sens Titlu complet în engleză traducere rusă Descriere
0 Not_Reordoned Nedeterminat Semne necombinabile și de încadrare; de asemenea multe semne pentru vocale și consoane, chiar dacă sunt combinabile
unu acoperire semn de suprapunere Caractere suprapuse pe o literă de bază sau un simbol
7 Nukta Nuqta Nukta - un semn în sistemele de scriere derivate din Brahmi
opt Kana_Voicing Semne kana vocale Semne vocale în kana - dakuten și handakuten
9 Virama Virama Virama este un semn în sistemele de scriere derivate din Brahmi
10-199 Ccc10—Ccc199 Clasele de combinabilitate canonică 10-199 Clasele cu poziții fixe
200 Atașat_Dedesubt_Stânga Semn de contact din stânga jos
202 Atașat mai jos Semnul de contact de mai jos
204
208
210
212
214 Atașat_Deasupra Semn de contact de sus
216 Atașat_Sus_Dreapta Semn de contact din dreapta sus
218 Dedesubt_stânga Semnează stânga jos
220 De mai jos semnează de jos
222 Dedesubt_Dreapta Semn dreapta jos
224 Stânga Semnează în stânga
226 Dreapta Semnul corect
228 Deasupra_Stânga Semnul din stânga sus
230 De mai sus semn de sus
232 Deasupra_Dreapta Semn dreapta sus
233 Double_Below semn dublu de mai jos
234 Dublu_Deasupra semn dublu deasupra
240 Iota_Subscript Iota interliniară Numai indicele grecesc iota

Vezi și

Note

  1. Cum funcționează textul Zalgo? . preaplin stiva . Preluat la 11 aprilie 2019. Arhivat din original la 27 mai 2019.
  2. Anexa standard Unicode #44 - Valori de clasă de combinare canonică . Consultat la 6 iunie 2019. Arhivat din original pe 8 iunie 2019.

Link -uri