Mnemonice în HTML

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 22 septembrie 2019; verificările necesită 109 editări .

Un caracter mnemonic ( eng.  entitate " entitate ") este o construcție SGML care se referă la un caracter din setul de caractere al unui fișier text. HTML are un număr mare de caractere speciale [1] predefinite . Pentru a insera un caracter special (caracter de control/format) în marcaj, trebuie să inserați în structura HTML caracterul mnemonic corespunzător acestui caracter.

Scop și sintaxă

Numire

Dacă trebuie să puneți orice caracter în textul de ieșire, puteți face acest lucru în două moduri:

Prima metodă nu se aplică bine caracterelor care au semnificație de format în HTML, cum ar fi parantezele unghiulare < și > (mai puțin decât și mai mare decât semnele). Astfel de scrisori nu vor fi întotdeauna percepute ca doar text. Complexitatea acestei metode este exacerbată de faptul că metoda de a determina dacă un anumit caracter este un format sau un caracter text depinde de browserul specific, deoarece fiecare dintre ele încearcă să repare erorile de sintaxă HTML în felul său și folosind caractere de format. în scopuri de formatare este tocmai o greșeală. Această metodă poate fi, de asemenea, incomodă atunci când trebuie să introduceți un caracter care nu este pe tastatură. De exemplu, nu există ghilimele pe tastatura standard Windows.

La editarea directă a codului sursă HTML folosind un editor de text, fișierul editat apare într-un font cu lățime fixă ​​( font cu lățime constantă), în care unele caractere pot părea greu de distins: în special, spații de lățimi și semnificații diferite ( de exemplu, „rupere” și „neruptură”) vor arăta toate la fel, linii orizontale diferite vor arăta la fel, la fel sau aproape la fel (liniuță-minus, minus , cratimă , cratimă care nu se rupe , cratima moale , en dash și em dash , etc.), ceea ce face ca lucrul cu ele să fie incomod. În multe fonturi cu lățime egală, impunerea literelor „modificatoare”, cum ar fi acute (accent rusesc, U + 0301), nu funcționează bine, din cauza cărora un astfel de modificator se poate suprapune nu pe caracterul anterior, ci pe următorul caracter, care creează o confuzie suplimentară. Și, în sfârșit, această metodă este complet inaplicabilă caracterelor care nu sunt în codificarea fișierului HTML.

Prin urmare, în toate aceste cazuri este mai bine (dacă nu este singurul posibil) să aplicați metoda numărul 2 - utilizați o sintaxă specială. Trebuie avut în vedere faptul că caracterele specificate într-un mod special își pierd sensul formatului, de exemplu, parantezele unghiulare încetează să evidențieze etichetele și un spațiu încetează să le separe atributele, ceea ce face posibilă utilizarea caracterelor de format ca doar caractere de text, aşezându-le într-un mod special.

Sintaxă

Specificarea unui caracter după numele său

Un caracter poate fi reprezentat în codul sursă HTML ca „& charname ;”, unde charname  este numele său. Citatelele nu fac parte din sintaxă. Literele majuscule sunt semnificative. Finalul punct și virgulă poate fi adesea omis: dacă în textul sursă după un astfel de caracter există un spațiu, o directivă HTML sau altceva care nu poate fi o continuare a numelui caracterului, atunci browserul înțelege totul corect. Mai mult, dacă numele dat nu este un prefix al altuia, atunci trailerul este opțional. Pe de altă parte, pentru a evita neînțelegerile, este mai bine să puneți întotdeauna finalizatorul [2] .

Exemplu: „&” ( ampersand ( în engleză  ampersand ), nume - „amp”) - „&”, să spunem, „John & Mary” - „John & Maria.”

Specificarea unui caracter prin numărul său unicode

Ca nume al oricărui caracter, puteți folosi numărul lui unicode , precedat de semnul „#” dacă numărul este zecimal, sau de combinația „#x” (semnul „#” și litera latină „x”) dacă numărul este hexazecimal . Adică, pentru un caracter cu număr unicode ddddd 10 , 0≤ddddd≤1114111 10 , puteți folosi numele #ddddd, iar pentru numărul unicode hhhh 16 , 0≤hhhh≤10FFFF 16  - #xhhhh sau #Xhhh. Numărul de cifre este nelimitat, zerourile inițiale (nesemnificative) nu contează, cazul literei „x” și al cifrelor hexazecimale ABCDEF nu este semnificativ [2] .

Exemplu: „&” ampersand, U+0026, (38 10 ); numele poate fi „#38” sau „#038” sau „#0038”, „#x26” sau „#x026” sau „#X0026”, etc.; „John & Mary” - „John & Maria.”

Litere „vechi”

Caracterele care au o valoare de format în HTML, atunci când sunt plasate direct în textul sursă fără înlocuire, pot cauza probleme sintactice. Este mai bine să le setați într-un mod special.

  • Semnul mai mic decât, U+003C (<);
  • Semnul Mai mare decât, U+003E (>);
  • ampersand (simbol Ampersand), U+0026 (&);
  • ghilimele duble (simbol citat), U+0022 (").

Fiecare dintre aceste caractere din HTML are două nume, unul cu litere mici și unul cu litere mari. Ambele nume pentru un caracter sunt exact aceleași, cu excepția cazului literelor. Acest lucru este din motive de compatibilitate, deoarece vechiul standard HTML nu ține seama de majuscule și minuscule pentru astfel de nume, astfel încât documentele HTML mai vechi pot folosi orice literă.

În prezent, se preferă forma minusculă, în timp ce forma majusculă este descurajată deoarece poate cauza probleme. Variantele de nume majuscule au fost introduse de browsere pentru a oferi compatibilitate reală cu documentele mai vechi față de standardul HTML și abia în versiunea 5.0 au fost introduse oficial în standard.

Există alte trei caractere cu aceleași variații majuscule/minuscule, dar fără nicio valoare specială de format în HTML - drepturi de autor (©), marcă înregistrată (®) și marcă comercială (™);

Aceste caractere au fost prezente și în standardul HTML în momentul în care a fost schimbat de la nume de caractere care nu țin cont de majuscule și minuscule, astfel încât regulile pentru ele sunt aceleași ca și pentru caracterele de format.

Numele tuturor literelor „vechi” (formatate și neformatate):

  • <—ltsauLT(este mai mic decât operator, U+003C, Latină de bază (ASCII));
  • > —gtsauGT(este mai mare decât operatorul, U+003E, Latină de bază (ASCII));
  • &-ampsauAMP(ampersand, U+0026, Latină de bază (ASCII));
  • „—quotsauCITAT(citat, U+0022, Latină de bază (ASCII));
  • © —copiesauCOPIE(semnul de drept de autor, U+00A9, supliment latin‑1);
  • ® -regsauREG(Semnul mărcii înregistrate, U+00AE, Supliment Latin-1);
  • ™ —comerţulsauCOMERȚUL(Semnul mărcii comerciale, U+2122, Simboluri asemănătoare literei);
Compatibilitate

În plus față de HTML, convențiile corespunzătoare sunt folosite în alte sisteme, cum ar fi XML , motorul Wikipedia , FB2 etc. Cu toate acestea, aceste sisteme nu respectă complet standardul HTML.

De exemplu, în XML, printre numele de caractere, sunt permise doar nume de caractere în format minuscule (inclusiv apostroful ), adică lt, gt, amp, quot și apos, atunci când se specifică caractere cu un număr Unicode hexazecimal, litera latină „x " trebuie să fie cu litere mici și este necesară punctul și virgulă. Motorul Wikipedia folosește nume de versiuni HTML anterioare 4.0 și necesită sfârșitul obligatoriu cu punct și virgulă. FB2 permite ca caracterele să fie specificate numai prin numere Unicode, în timp ce unii handlere FB2 limitează în plus aceste numere doar la numere zecimale.

Astfel, cel mai compatibil mod de specificare este prin numere zecimale cu un trailer obligatoriu. Dacă sunt folosite nume hexazecimale, este mai bine să păstrați litera latină „x” cu litere mici, iar cifrele hexazecimale ABCDEF cu litere mari. Dintre nume, lt, gt, amp și quot sunt cele mai standard (în XML, apos este, de asemenea, standard). În caz contrar, ar trebui să vă ghidați după standardul HTML 4.0, folosirea numelor versiunii 5.0 este cea mai puțin sigură.

Tabele de referințe mnemonice

Caracterele de control C0 și limba latină de bază

U+0000—U+007F

Această gamă Unicode este pe deplin compatibilă cu standardul ASCII, cu excepția convenției de suprapunere a caracterelor prin backspace. [3]

Simbol Scop Mnemonice HTML Codul
U+0000-U+001F - caractere de control C0
tabulare - HT (ANSI), GT (GOST) 5.0 U+0009
avans de linie - LF (ANSI), PS (GOST) &linie nouă; 5.0 U+000A
U+0032—U+007E — Latină de bază
spaţiu U+0020
! Semn de exclamare ! 5.0 U+0021 !
" ghilimele duble [4] " 5.0 U+0022 "
" 2.0
# semnul numeric ("hash" sau "sharp") # 5.0 U+0023 #
$ semnul dolarului &dolar; 5.0 U+0024 $
% semn de procente % 5.0 U+0025 %
& ampersand & 5.0 U+0026 &
& 1.0/2.0
' ghilimele simple (ocupând poziția unui apostrof) [5] ' 5.0 U+0027 '
( paranteza stângă ( 5.0 U+0028 (
) paranteza dreapta ) 5.0 U+0029 )
* asterisc (poate fi atât mare cât și mediu) [6] [7] * 5.0 U+002A *
*
+ semnul plus &la care se adauga; 5.0 U+002B +
, virgula [8] &virgulă; 5.0 U+002C ,
- liniuță-minus (nu este recomandat pentru utilizare) [9] [10] U+002D -
. punct [11] &perioadă; 5.0 U+002E .
/ slash (solidus) [12] [13] / 5.0 U+002F /
U+0030-U+0039 - numerele 0-9 [14]
: colon : 5.0 U+003A :
; punct şi virgulă ; 5.0 U+003B ;
< mai putin semn < 5.0 U+003C <
< 1.0/2.0
= semn egal &egal; 5.0 U+003D =
> semn mai mare > 5.0 U+003E >
> 1.0/2.0
? semnul întrebării ? 5.0 U+003F ?
@ comercial "la" @ 5.0 U+0040 @
U+0041—U+005A — majuscule latine A—Z [15]
[ paranteză pătrată stângă [ 5.0 U+005B [
[
\ bară oblică inversă [16] \ 5.0 U+005C \
] paranteză pătrată dreaptă ] 5.0 U+005D ]
]
^ trăsuri - (pot fi atât înalte, cât și medii) [17] [18] &Pălărie; 5.0 U+005E ^
_ subliniere pozițională (ar trebui să se stivuească orizontal) [19] _ 5.0 U+005F _
&underbar;
` apostrof invers care ocupă poziția (mormânt) [20] &mormânt; 5.0 U+0060 `
`
U+0061—U+007A — litere latine mici a—z [21]
{ bretele stângi { 5.0 U+007B {
{
| bară verticală [22] | 5.0 U+007C |
|
&Linie verticala;
} bretele drepte } 5.0 U+007D }
}
~ tilde pozițională (poate fi mare sau medie, nerecomandat) [23] [24] U+007E ~
U+007F - caractere de control C0

Caracterele de control C1 și complementul Latin-1

U+0080—U+00FF

Din punct de vedere istoric, intervalul U+00A0-U+00FF ("Complementul Latin-1") conținea caractere din pozițiile corespunzătoare Latin-1 ( ISO 8859-1 ) până când standardul Latin-1 a fost declarat pe deplin încorporat în Unicode - ca ASCII ( U+0000-U+007F) și acest interval (U+0080-U+00FF), cu excepția convenției de suprapunere a caracterelor prin backspace.

Simbol Scop Mnemonice HTML Codul
U+0080-U+009F - caractere de control C1
U+00A0—U+00FF este o adăugare din latină-1
  spatiu de nerupere   5.0 U+00A0  
  3.2
¡ semnul exclamării inversat &ie excl; 3.2 U+00A1 ¡
¢ simbolul centului ¢ 3.2 U+00A2 ¢
£ simbolul lire sterline &livră; 3.2 U+00A3 £
¤ semn valutar &actual; 3.2 U+00A4 ¤
¥ simbolul yenului și yuanului ¥ 3.2 U+00A5 ¥
¦ bară verticală spartă &brkbar; non-standard U+00A6 ¦
¦ 3.2
§ semnul paragrafului §ă; 3.2 U+00A7 §
¨ diereza, trema
umlaut
(toată lumea ia o poziție)
&a muri; 5.0 U+00A8 ¨
&Punct; 5.0
¨ 5.0
&um; 3.2
© semnul dreptului de autor &COPIE; 5.0 U+00A9 ©
&copie; 3.2
ª indicator ordinal (feminin) ª 3.2 U+00AA ª
" citatul cu unghi dublu îndreptat spre stânga « 3.2 U+00AB «
¬ semn negativ _ ν 3.2 U+00AC ¬
­ cratima moale (indică locul unei posibile silabe: dacă nu există cratima, este invizibilă, dacă există, este vizibilă ca cratimă înainte de o întrerupere de linie). În exemplu, din cauza absenței unui transfer, este invizibil. &timid; 3.2 U+00AD ­
® semn de protecție legală a mărcii ® 5.0 U+00AE ®
® 5.0
® 3.2
¯ macron titular .hibar. non-standard U+00AF ¯
¯on; non-standard
¯ 5.0
¯ 3.2
° semnul gradului pozițional °ree; non-standard U+00B0 °
° 3.2
± plus sau minus &p.m; 5.0 U+00B1 ±
&Plus minus; 5.0
± 3.2
² indicele „2” ² 3.2 U+00B2 ²
³ indicele „3” ³ 3.2 U+00B3 ³
´ incumbentă acută ´ 5.0 U+00B4 ´
&acut; 3.2
µ prefix micro
micron - denumire învechită a micrometrului
µ 3.2 U+00B5 µ
marca de paragraf 3.2 U+00B6 ¶
· interpunct · 5.0 U+00B7 ·
· 5.0
· 3.2
¸ cedilla _ &Sedilă; 5.0 U+00B8 ¸
¸ 3.2
¹ indicele „1” ¹ 3.2 U+00B9 ¹
º indicator ordinal (masculin) º 3.2 U+00BA º
» citatul cu unghi dublu îndreptat spre dreapta " 3.2 U+00BB »
¼ fracție simplă „un sfert” ¼ 3.2 U+00BC ¼
½ fracție simplă „o jumătate” .alfa. 5.0 U+00BD ½
½ 3.2
¾ fracție simplă „trei sferturi” ¾ 3.2 U+00BE ¾
¿ semnul întrebării cu capul în jos ¿ 3.2 U+00BF ¿
A latină A majusculă cu grav („accent tocit”) &Un mormânt; 2.0 U+00C0 À
A A latină majusculă cu accent acut &Acut; 2.0 U+00C1 Á
A A majuscul latin cu circumflex  2.0 U+00C2 Â
A A majuscul latin cu tilde à 2.0 U+00C3 Ã
A A majuscul latin cu trema Ä 2.0 U+00C4 Ä
A A majuscul latin cu un cerc deasupra &un inel; 2.0 U+00C5 Å
Æ ligatură majusculă latină AE Æ 2.0 U+00C6 Æ
Z C majuscul latin cu cedilla Ç 2.0 U+00C7 Ç
È E majuscul latin cu mormânt è 2.0 U+00C8 È
É E majuscul latin cu acută É 2.0 U+00C9 É
Ê E majuscul latin cu circumflex Ê 2.0 U+00CA Ê
Ë E majuscul latin cu treme Ë 2.0 U+00CB Ë
Ì latină majusculă I cu mormânt &mormânt; 2.0 U+00CC Ì
Í latină majusculă I cu acută Í 2.0 U+00CD Í
О I majuscul latin cu circumflex Î 2.0 U+00CE Î
П latină majusculă I cu trema Ï 2.0 U+00CF Ï
R literă majusculă latină „eth” Ð 2.0 U+00D0 Ð
Ñ N majuscul latin cu tilde Ñ 2.0 U+00D1 Ñ
Ò latină majusculă O cu mormânt ò 2.0 U+00D2 Ò
o latină O majusculă cu acută ó 2.0 U+00D3 Ó
Ô O majusculă latină cu circumflex Ô 2.0 U+00D4 Ô
Õ O majusculă latină cu tildă Õ 2.0 U+00D5 Õ
Ö latină majusculă O cu treme Ö 2.0 U+00D6 Ö
× semn de înmulțire .ori. 3.2 U+00D7 ×
Ø latină majusculă O încrucișată în diagonală Ø 2.0 U+00D8 Ø
Ù U majuscul latin cu mormânt Ù 2.0 U+00D9 Ù
U latină U majusculă cu acută Ú 2.0 U+00DA Ú
Û U majuscul latin cu circumflex Û 2.0 U+00DB Û
Ü latină U majusculă cu treme Ü 2.0 U+00DC Ü
E Y majuscul latin cu acută Ý 2.0 U+00DD Ý
Þ literă majusculă latină Thorn (THORN) &GHIMPE; 2.0 U+00DE Þ
ß latin mic escet ß 2.0 U+00DF ß
A litera latină mică „a” cu mormânt &un mormânt; 2.0 U+00E0 à
A „a” mic latin cu un acut á 2.0 U+00E1 á
A „a” mic latin cu circumflex â 2.0 U+00E2 â
A „a” mic latin cu tilde ã 2.0 U+00E3 ã
A latin „a” mic cu treme ä 2.0 U+00E4 ä
e „a” mic latin cu un cerc deasupra &un inel; 2.0 U+00E5 å
æ ligatură mică latină „ae” æ 2.0 U+00E6 æ
ç „c” mic latin cu cedilla ç 2.0 U+00E7 ç
e litera latină mică „e” cu mormânt è 2.0 U+00E8 è
e latină „e” mic cu acută é 2.0 U+00E9 é
ê latin „e” mic cu circumflex ê 2.0 U+00EA ê
l latin „e” mic cu trema ë 2.0 U+00EB ë
м „i” mic latin cu mormânt ì 2.0 U+00EC ì
i „i” mic latin cu acută í 2.0 U+00ED í
î „i” mic latin cu circumflex î 2.0 U+00EE î
i latin „i” mic cu trema ï 2.0 U+00EF ï
ð "eth" latin mic .eth; 2.0 U+00F0 ð
ñ „n” mic latin cu tilde ñ 2.0 U+00F1 ñ
o litera latină mică „o” cu mormânt ò 2.0 U+00F2 ò
o latină „o” mic cu acută ó 2.0 U+00F3 ó
o „O” mic latin cu circumflex ô 2.0 U+00F4 ô
õ latină „o” mic cu tilde õ 2.0 U+00F5 õ
o latină „o” mic cu trema ö 2.0 U+00F6 ö
÷ semn de diviziune ÷ 5.0(?) U+00F7 ÷
÷ 3.2
ø litera latină mică „o” tăiată diagonală ø 2.0 U+00F8 ø
u „u” mic latin cu mormânt ù 2.0 U+00F9 ù
u "u" mic latin cu acută ? 2.0 U+00FA ú
û "u" mic latin cu circumflex û 2.0 U+00FB û
u latină „u” mic cu trema ü 2.0 U+00FC ü
ý latină „y” mic cu acută ý 2.0 U+00FD ý
þ latină minuscul „ghimpe” (ghimpe) &ghimpe; 2.0 U+00FE þ
ÿ latin „y” mic cu treme &yum; 2.0 U+00FF ÿ

Expansiune latină - A

U+0100—U+017F

Simbol Scop Mnemonice HTML Codul
A latină majusculă „A” cu macron Ā 5.0 U+0100 Ā
A „a” mic latin cu macron ā 5.0 U+0101 ā
A latină majusculă „A” cu scurtă ă 5.0 U+0102 Ă
A latină „a” mic cu breve ă 5.0 U+0103 ă
A latină majusculă „A” cu ogonek Ą 5.0 U+0104 Ą
A „a” mic latin cu ogonek ą 5.0 U+0105 ą
eu latină majusculă „C” cu acută ć 5.0 U+0106 Ć
c „c” mic latin cu un acut ć 5.0 U+0107 ć
Ĉ „C” majuscul latin cu circumflex Ĉ 5.0 U+0108 Ĉ
e „c” mic latin cu circumflex ĉ 5.0 U+0109 ĉ
Ċ „C” majuscul latin cu punct deasupra Ċ 5.0 U+010A Ċ
ċ „c” mic latin cu punct deasupra ċ 5.0 U+010B ċ
Č latină majusculă „C” cu o pasăre Č 5.0 U+010C Č
c „c” mic latin cu o pasăre č 5.0 U+010D č
Ď latină majusculă „D” cu o pasăre Ď 5.0 U+010E Ď
ď „d” mic latin cu o pasăre (în fonturi, se preferă apostroful) ď 5.0 U+010F ď
Đ „D” majuscul latin cu o contur orizontal. Poate să nu arate diferit de Eth (Ð, U+00D0, Ð) Đ 5.0 U+0110 Đ
đ „d” mic latin cu o contur orizontal. Poate arăta la fel cu eth (ð, U+00F0, ð) đ 5.0 U+0111 đ
Ē "E" majuscul latin cu macron Ē 5.0 U+0112 Ē
ē „e” mic latin cu macron ē 5.0 U+0113 ē
Ĕ latină majusculă „E” cu scurtă U+0114 Ĕ
ĕ „e” mic latin cu breve U+0115 ĕ
Ė "E" majuscul latin cu punct deasupra Ė 5.0 U+0116 Ė
e „E” mic latin cu punct deasupra ė 5.0 U+0117 ė
Ę latină majusculă „E” cu ogonek Ę 5.0 U+0118 Ę
e „e” mic latin cu ogonek ę 5.0 U+0119 ę
Ě „E” majuscul latin cu o pasăre Ě 5.0 U+011A Ě
e litera latină mică „e” cu o pasăre ě 5.0 U+011B ě
Ĝ „G” majuscul latin cu circumflex Ĝ 5.0 U+011C Ĝ
e „g” latinesc mic cu circumflex ĝ 5.0 U+011D ĝ
Ğ latină majusculă „G” cu scurtă Ğ 5.0 U+011E Ğ
ğ „g” mic latin cu breve ğ 5.0 U+011F ğ
A „G” majuscul latin cu punct deasupra Ġ 5.0 U+0120 Ġ
e „G” mic latin cu punct deasupra ġ 5.0 U+0121 ġ
Ģ „G” majuscul latin cu sita Ģ 5.0 U+0122 Ģ
ģ „g” mic latin cu strecurătoare U+0123 ģ
Ĥ "H" majuscul latin cu circumflex Ĥ 5.0 U+0124 Ĥ
e „h” mic latin cu circumflex ĥ 5.0 U+0125 ĥ
Ħ „H” majuscul latin cu o contur orizontal Ħ 5.0 U+0126 Ħ
ħ „h” mic latin cu o contur orizontal ħ 5.0 U+0127 ħ
Ĩ „I” majuscul latin cu tildă Ĩ 5.0 U+0128 Ĩ
ĩ „i” mic latin cu tilde ĩ 5.0 U+0129 ĩ
e „I” majuscul latin cu macron Ī 5.0 U+012A Ī
i „i” mic latin cu macron ī 5.0 U+012B ī
Ĭ latină majusculă „I” cu breve U+012C Ĭ
ĭ „i” mic latin cu breve U+012D ĭ
Į latină majusculă „I” cu ogonek į 5.0 U+012E Į
i „i” mic latin cu ogonek į 5.0 U+012F į
İ „I” majuscul latin cu punct deasupra İ 5.0 U+0130 İ
eu „i” mic latin fără punct deasupra &imathan; 5.0 U+0131 ı
ı
IJ Ligatură majusculă latină „IJ” IJ 5.0 U+0132 IJ
ij ligatură mică latină „ij” ij 5.0 U+0133 ij
Ĵ „J” majuscul latin cu circumflex Ĵ 5.0 U+0134 Ĵ
ĵ „j” mic latin cu circumflex ĵ 5.0 U+0135 ĵ
Ķ "K" majuscul latin cu sita Ķ 5.0 U+0136 Ķ
i „k” mic latin cu strecurătoare ķ 5.0 U+0137 ķ
ĸ „kra” mic latin (groenlandez „k”) ĸ 5.0 U+0138 ĸ
Ĺ latină majusculă „L” cu acută Ĺ 5.0 U+0139 Ĺ
ĺ litera latină mică „l” cu acută ? 5.0 U+013A ĺ
Ļ „L” majuscul latin cu sita ļ 5.0 U+013B Ļ
ļ latină „l” mic cu sită ļ 5.0 U+013C ļ
i „L” majuscul latin cu o pasăre (în fonturi, se preferă apostroful) ľ 5.0 U+013D Ľ
ľ litera latină mică „l” cu o pasăre (în fonturi, se preferă apostroful) ľ 5.0 U+013E ľ
Ŀ „L” majuscul latin cu un punct în mijloc Ŀ 5.0 U+013F Ŀ
ŀ „l” mic latin cu un punct în mijloc ŀ 5.0 U+0140 ŀ
l „L” majuscul latin cu o contur orizontal Ł 5.0 U+0141 Ł
ł Litera latină "l" mică cu o contur orizontal ł 5.0 U+0142 ł
Ń latină majusculă „N” cu acută Ń 5.0 U+0143 Ń
ń latin „n” mic cu acut ń 5.0 U+0144 ń
Ņ "N" majuscul latin cu sita Ņ 5.0 U+0145 Ņ
ņ latină „n” mic cu sită ņ 5.0 U+0146 ņ
Z „N” majuscul latin cu o pasăre Ň 5.0 U+0147 Ň
ň litera mică latină „n” cu o pasăre ň 5.0 U+0148 ň
ʼn „n” mic latin precedat de un apostrof ʼn 5.0 U+0149 ʼn
Ŋ majuscula latină "ENG" &RO; 5.0 U+014A Ŋ
ŋ "eng" latin mic ŋ 5.0 U+014B ŋ
Ō latină majusculă „O” cu macron Ō 5.0 U+014C Ō
ō „o” mic latin cu macron ō 5.0 U+014D ō
Ŏ latină majusculă „O” cu scurtă U+014E Ŏ
ŏ „o” mic latin cu breve U+014F ŏ
Ő "O" majuscul latin cu acut dublu Ő 5.0 U+0150 Ő
ő "o" mic latin cu acut dublu ő 5.0 U+0151 ő
Œ Ligatură majusculă latină „OE” Œ 4.0 U+0152 Œ
- ligatură mică latină „oe” œ 4.0 U+0153 œ
Ŕ latină majusculă „R” cu acută &Rată; 5.0 U+0154 Ŕ
ŕ „r” mic latin cu un acut ŕ 5.0 U+0155 ŕ
Ŗ "R" majuscul latin cu sita Ŗ 5.0 U+0156 Ŗ
ŗ latin „r” mic cu strecurătoare ŗ 5.0 U+0157 ŗ
Ř latină majusculă „R” cu o pasăre Ř 5.0 U+0158 Ř
r litera mică latină „r” cu o pasăre ˇ 5.0 U+0159 ř
S latină majusculă „S” cu acută Ś 5.0 U+015A Ś
S "s" mic latin cu un acut ś 5.0 U+015B ś
Ŝ „S” majuscul latin cu circumflex Ŝ 5.0 U+015C Ŝ
ș „s” mic latin cu circumflex ŝ 5.0 U+015D ŝ
Ş "S" majuscul latin cu sita Ş 5.0 U+015E Ş
s „s” mic latin cu strecurătoare ş 5.0 U+015F ş
S „S” majuscul latin cu o pasăre & Scaron; 4.0 U+0160 Š
s litera latină mică „s” cu o pasăre š 4.0 U+0161 š
Ţ „T” majuscul latin cu sită Ţ 5.0 U+0162 Ţ
ţ „t” mic latin cu strecurătoare ţ 5.0 U+0163 ţ
Ť „T” majuscul latin cu o pasăre Ť 5.0 U+0164 Ť
ť „t” literă latină cu o pasăre (în fonturi, se preferă apostroful) ť 5.0 U+0165 ť
Ŧ „T” majuscul latin cu o contur orizontal Ŧ 5.0 U+0166 Ŧ
ŧ „t” mic latin cu o contur orizontal ŧ 5.0 U+0167 ŧ
× latină majusculă „U” cu tildă Ũ 5.0 U+0168 Ũ
ũ „u” mic latin cu tildă ũ 5.0 U+0169 ũ
Ū "U" majuscul latin cu macron Ū 5.0 U+016A Ū
ū „u” mic latin cu macron ū 5.0 U+016B ū
Ŭ latină majusculă „U” cu scurtă Ŭ 5.0 U+016C Ŭ
ŭ „u” mic latin cu breve ŭ 5.0 U+016D ŭ
Ů „U” majuscul latin cu un inel deasupra Ů 5.0 U+016E Ů
ů "u" mic latin cu un inel deasupra ů 5.0 U+016F ů
Ű "U" majuscul latin cu dublu acut Ű 5.0 U+0170 Ű
ű "u" mic latin cu acut dublu ű 5.0 U+0171 ű
Ų latină majusculă „U” cu ogonek Ų 5.0 U+0172 Ų
ų „u” mic latin cu ogonek ų 5.0 U+0173 ų
Ŵ „W” majuscul latin cu circumflex Ŵ 5.0 U+0174 Ŵ
ŵ „w” mic latin cu circumflex ŵ 5.0 U+0175 ŵ
z "Y" majuscul latin cu circumflex Ŷ 5.0 U+0176 Ŷ
ŷ „y” latinesc mic cu circumflex ŷ 5.0 U+0177 ŷ
Ÿ "Y" majuscul latin cu trema Ÿ 4.0 U+0178 Ÿ
Ź latină majusculă „Z” cu acută Ź 5.0 U+0179 Ź
ź litera latină mică „z” cu acută ź 5.0 U+017A ź
Z „Z” majuscul latin cu punct deasupra Ż 5.0 U+017B Ż
z „z” mic latin cu un punct deasupra ż 5.0 U+017C ż
Z „Z” majuscul latin cu o pasăre Ž 5.0 U+017D Ž
z litera latină mică „z” cu o pasăre ž 5.0 U+017E ž
ſ "s lung" mic latin U+017F ſ

Expansiune latină - B

U+0180—U+024F

Simbol Scop Mnemonice HTML Codul
ƒ • Literă f latină cu o coadă dedesubt (uneori numită f scris de mână, de fapt vertical sau italic)
• Semnul Florin
• Simbolul funcției
• Acesta nu este un f latin cursiv obișnuit (𝑓, U+1D453), deși, în funcție de font, acesta poate arata ca este foarte asemanator
ƒ 4.0 U+0192 ƒ
Ƶ „Z” majuscul latin cu o contur orizontal &impeded; 5.0 U+01B5 Ƶ
ǵ „g” latinesc mic cu acut &gacut; 5.0 U+01F5 ǵ
ȷ „j” mic latin fără punct deasupra ȷ 5.0 U+0237 ȷ

Modificatori de litere care ocupă poziția

U+02B0—U+02FF

Simbol Scop Mnemonice HTML Codul
ˆ accent de pasăre inversat/circumflex ˆ 4.0 U+02C6 ˆ
ˇ birdie cu accent pozițional (hachek) ˇ 5.0 U+02C7 ˇ
ˇ
˘ breve ˘ 5.0 U+02D8 ˘
˘
˙ punct de reținere de mai sus &punct; 5.0 U+02D9 ˙
˙
˚ cerc titular deasupra &inel; 5.0 U+02DA ˚
˛ ogonek ˛ 5.0 U+02DB ˛
˜ tildă mică care ocupă poziţia ˜ 5.0 U+02DC ˜
˜ 4.0
˝ ocupant al poziţiei duble acute ˝ 5.0 U+02DD ˝
˝

Diacritice combinabile

U+0300—U+036F

Simbol Scop Mnemonice HTML Codul
 - semn de accent combinat (akut - plasat imediat după litera peste care ar trebui să fie afișat) U+0301 ́
 ̑ brevet inversat combinat (plasat imediat după litera peste care ar trebui să fie afișat) &DownBrave; 5.0 U+0311 ̑

Simboluri grecești și copte

U+0370-U+03FF

Include alfabetul grecesc .

Simbol Scop Mnemonice HTML Codul
Α alfa majuscul grecesc .alfa. 4.0 U+0391 Α
Β capitala greacă beta .beta. 4.0 U+0392 Β
Γ scara de capital greacă γ 4.0 U+0393 Γ
Δ Delta capitala Greciei .delta. 4.0 U+0394 Δ
Ε Epsilon capital grecesc ε 4.0 U+0395 Ε
Z capitala greacă zeta Ζ 4.0 U+0396 Ζ
Η capitala greacă eta .Eta. 4.0 U+0397 Η
Θ capitala greacă theta .theta. 4.0 U+0398 Θ
eu iota de capital grecesc &iotă; 4.0 U+0399 Ι
K capitala greacă kappa Κ 4.0 U+039A Κ
Λ Lambda capitală grecească Λ 4.0 U+039B Λ
M capitala greacă mu μ 4.0 U+039C Μ
N Nud capital grecesc Ν 4.0 U+039D Ν
Ξ capitala greacă xi Ξ 4.0 U+039E Ξ
Ο majuscul grecesc omicron Ο 4.0 U+039F Ο
Π majuscul grecesc pi Π 4.0 U+03A0 Π
P capitala greaca ro Ρ 4.0 U+03A1 Ρ
Σ sigma capitală greacă Σ 4.0 U+03A3 Σ
Τ capitala greacă tau .tau. 4.0 U+03A4 Τ
Υ capitala greacă upsilon υ 4.0 U+03A5 Υ
Φ capital grecesc fi .phi. 4.0 U+03A6 Φ
X chi capital grecesc Χ 4.0 U+03A7 Χ
Ψ psi capital grecesc Ψ 4.0 U+03A8 Ψ
Ω • Omega majuscul grecesc
•  Ohm (unitate de rezistență electrică) - recomandat în locul caracterului special introdus anterior „Ohm” U+2126 (Ω, Ω)
Ω 5.0 U+03A9 Ω
Ω 4.0
α Alfa literă greacă α 4.0 U+03B1 α
β Beta mic grecesc .beta. 4.0 U+03B2 β
γ Greacă la scară mică .gamma. 4.0 U+03B3 γ
δ Mica delta greceasca .delta. 4.0 U+03B4 δ
ε epsilon mic grecesc ε 5.0 U+03B5 ε
ε 4.0
ζ zeta mic grecesc .zeta. 4.0 U+03B6 ζ
η greacă minusculă eta .eta. 4.0 U+03B7 η
θ Theta mic grecesc .theta. 4.0 U+03B8 θ
v Iota mică grecească &iotă; 4.0 U+03B9 ι
κ Kappa literă greacă κ 4.0 U+03BA κ
λ Lambda literă greacă λ 4.0 U+03BB λ
μ greacă literă mu μ 4.0 U+03BC μ
v nud grecesc minuscule ν 4.0 U+03BD ν
ξ grec mic xi ξ 4.0 U+03BE ξ
ο omicron mic grecesc ο 4.0 U+03BF ο
π grecesc pi mic π 4.0 U+03C0 π
p grecesc mic ro ρ 4.0 U+03C1 ρ
ς Sigma minuscule greacă finală ς 5.0 U+03C2 ς
ς 5.0
ς 4.0
σ sigma greacă minusculă σ 4.0 U+03C3 σ
τ grecesc mic tau .tau. 4.0 U+03C4 τ
υ Literă greacă mică Upsilon υ 5.0 U+03C5 υ
υ 4.0
φ grec mic fi .phi. 4.0 U+03C6 φ
χ Chi mic grecesc χ 4.0 U+03C7 χ
ψ psi mic grecesc ψ 4.0 U+03C8 ψ
ω omega mic grecesc ω 4.0 U+03C9 ω
ϑ Theta simbolică grecească .theta. 5.0 U+03D1 ϑ
ϑ 5.0
.thetasym. 4.0
ϒ Upsilon grecesc cu coada de cal υ 5.0 U+03D2 ϒ
ϒ 4.0
ϕ simbol grecesc phi ϕ 5.0 U+03D5 ϕ
ϕ 5.0
.phi. 5.0
ϖ caracter grecesc pi ϖ 5.0 U+03D6 ϖ
ϖ 4.0
Ϝ Digamma capitală greacă Ϝ 5.0 U+03DC Ϝ
ϝ Digamma literă greacă γ 5.0 U+03DD ϝ
ϝ 5.0
ϰ caracter grec kappa ϰ 5.0 U+03F0 ϰ
ϰ 5.0
ϱ caracter grec ro ϱ 5.0 U+03F1 ϱ
ϱ 5.0
ϵ Epsilon simbolic grecesc (epsilon direct, epsilon lunar) ϵ 5.0 U+03F5 ϵ
ϵ 5.0
ϵ 5.0
϶ Epsilon inversat grecesc (epsilon lunar invers) ϶ 5.0 U+03F6 ϶
? 5.0

Punctuația generală

Simbol Scop Mnemonice Codul
un spațiu de lungime N (un spațiu lung, de dimensiunea unei liniuțe em)
un spațiu de lungime M (un spațiu foarte lung, aproximativ de dimensiunea unei liniuțe em)
decalaj îngust
‌‌ lățimea zero non-joiner - interzicerea lipirii ( ligaturii ) a caracterelor adiacente
‍‍ tamplar cu lățime zero - o cerere de lipire ( ligatură ) a caracterelor adiacente
semn de la stânga la dreapta - un semn al începutului textului, citit de la stânga la dreapta
semn de la dreapta la stânga - un semn al începutului textului citit de la dreapta la stânga &lm;
- cratima care nu se rupe (neseparabila) / cratima care nu se rupe  
- en liniuță (liniuță de lungime N)
em liniuță (liniuță de lungime M)
' ghilimele unice de genul „nouă inversate superioare”
' ghilimele unice precum „superior nouă”
ghilimele simple precum „inferior nouă”
ghilimele unice de genul „nouă inversate superioare”
ghilimele duble precum „nouă inversate superioare” & ldquo;
ghilimele duble precum „superior nouă”
ghilimele duble precum „inferior nouă”
ghilimele duble de genul „nouă inversate superioare”
cruce tipografică &pumnal;
cruce tipografică dublă &Pumnal;
marcator de listă (marcator) X
elipsă orizontală &helli;
ppm
trapă &prim;
cursă dublă &Prim;
citat cu un singur unghi orientat spre stânga (propus, dar încă nestandardizat de ISO, aproape peste tot)
citat cu un singur unghi orientat spre dreapta (propus, dar încă nestandardizat de ISO, aproape peste tot)
supralinie pozițională
 ⁄  caracter combinabil fracție-liniuță (1⁄2→ ½,3⁄4→ ¾,12⁄23→ 12⁄23, dacă este necesar, succesiunea de cifre este limitată la un spațiu de lungime zero (​) sau un spațiu fără rupere de lungime zero (⁠):12​34⁄56→ 12​34⁄56,2⁠99⁄100→ 2⁠99⁄100)

Simboluri valutare

Simbol Scop Mnemonice Codul
Euro
rublă

Caractere asemănătoare literei

Simbol Scop Mnemonice Codul
I majuscul gotic (litera gotică latină obișnuită) = parte imaginară &imagine;
Nu. Semnul numărului &număr; (HTML 5.0)
funcția eliptică Weierstrass sau mulțimea tuturor submulților. Un singur caracter, >nu P majuscul scris de mână (𝒫, 풫)
R majuscul gotic (litera gotică latină obișnuită) = parte reală
marcă ™ — nu peste tot
litera matematică Aleph = cardinal infinit - spre deosebire de litera ebraică Aleph (‎א‎, א) se citește de la stânga la dreapta

Forme de număr

Simbol Scop Mnemonice Codul
fracție simplă „o treime” ⅓ (HTML 5.0)

Săgeți

Simbol Scop Mnemonice Codul
La stânga
sus
dreapta
mult mai jos
stanga dreapta
în jos înclinat dreapta = întoarcere cărucior
săgeată dublă stânga
dubla
dublu dreapta
dublează
dublu stânga-dreapta
La stânga
sus
dreapta
mult mai jos

Operații matematice

Simbol Scop Mnemonice Codul
cuantificator universal (pentru toți...) &pentru toți;
derivat parțial &parte;
cuantificator existențial (există...) &exista;
set gol (diametru) &gol;
nabla &nab;
aparține &este in;
nu apartin &nu în;
conţine
multiplicare
suma peste set &sumă;
minus - nu o liniuță-minus din ASCII, are aceleași dimensiuni și aceeași poziție a cursei orizontale ca „+”
diviziune (nu slash ASCII)
setați diferența (nu ASCII backslash) ∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
asterisc (garantat pentru a nu fi ridicat deasupra șirului)
rădăcină pătrată = semn radical
in proportie de &recuzită;
infinit
colţ
conjuncție (ȘI logic) = pană &și;
disjuncție (SAU logic) = vee &sau;
intersecție = cap &capac;
union = cup &ceașcă;
integrală
prin urmare, prin urmare = prin urmare &acolo4;
echivalent cu (pentru infinitezimal/mare) = similar cu
congruent = este aproximativ egal (congruent) cu
aproximativ egal cu = este aproape egal (asimptotic) cu
= nu este egal cu
identic egal, logic echivalent = este echivalent cu
mai mic sau egal cu = este mai mic sau egal cu
mai mare sau egal cu = este mai mare sau egal cu &GE;
subset = este subset de
include = este superset al &cina;
nu este un subset al
subset de sau echivalent cu ?
include sau echivalent = este superset al sau echivalent cu
plus în cerc = suma directă
înmulțire cu o cruce [oblică] într-un cerc = produs tensor
up tack = ortogonal la = perpendicular
înmulțirea punctelor = produs punctual

Simboluri tehnice

Simbol Scop Mnemonice Codul
rotunjire sus paranteză stângă = apl upstile
rotunjesc paranteza dreapta
rotunjire în jos paranteză stângă = apl downstile &etaj;
rotunjind în jos paranteza dreaptă
unghi bracket left = sconce
bracket unghi drept = ket

Forme geometrice

Simbol Scop Mnemonice Codul
romb

Caractere diverse

Simbol Scop Mnemonice Codul
pică (costum de cărți) &pică;
cluburi (costum de carte)
inimi (costum de carte)
diamante (cost de carte)

Note

  1. HTML5. Referințe de caractere denumite .
  2. 1 2 Reprezentare document HTML .
  3. Suprapunerea Backspace este folosită în ASCII pentru a reda caractere combinate (u␈` → ù) și variante aldine (u␈u → u ). Toate secvențele standardului ASCII, care ilustrează caractere combinate, precum și versiunile îndrăznețe ale caracterelor alfanumerice, au omologi Unicode, dar nu prin traducerea „litera-la-litera”, ci prin înlocuirea secvenței de caractere ASCII cu un caracter Unicode. Variantele aldine ale altor caractere ASCII nu au corespondență și trebuie reprezentate prin mijloace în afara standardului Unicode. Deoarece multe fonturi nu conțin variante de litere aldine, imaginea lor depinde în mare măsură de caracteristicile sistemului de afișare a textului (înlocuirea literelor și a fonturilor), așa că este de preferat să setați stiluri aldine folosind instrumente non-Unicode.
  4. suprapunerea unei ghilimele duble prin backspace în ASCII (␈") în Unicode este reprezentată de caracterul combinabil „dublu-acut” „̋”U+030B(̋) sau „liniuță verticală dublă deasupra” „̎”U+030E(̏)
  5. Suprapunerea apostrofului prin pas înapoi în ASCII (␈') în Unicode este reprezentată de caracterul „acut” combinat „ ́”U+0301(́)
  6. pentru a obține exact asteriscul din mijloc, trebuie să utilizați operația matematică „∗”U+2217 ∗(∗)
  7. Suprapunerea unui asterisc prin trecerea înapoi în ASCII (␈*) în Unicode este reprezentată de caracterul combinabil „asterisc deasupra” „⃰”U+20F0(⃰)
  8. Suprapunerea unei virgule prin trecerea înapoi în ASCII (␈,) în Unicode este reprezentată de simbolul combinabil „virgulă sub” „̦”U+0326(̦)
  9. cratima „-” ar trebui folosită ca cratimăU+2010(‐), cratima neîntreruptă „-”U+2011(‑) și înveliș moale ""U+00AD &timid;(­); ca liniuță - liniuță scurtă „-”U+2013 –(–), liniuța „—”U+2014 —(—), liniuță cu lățime egală („digitală”) „‒”U+2012(‒) si altii; ca minus - semnul matematic "-"U+2212 −(−)
  10. suprapunerea unui liniuță-minus prin trecerea înapoi în ASCII (␈-) în Unicode este reprezentată de simbolul combinat „cură orizontală scurtă” „̵”U+0335(̵), sau, dacă vrei să spui barare continuă (cu îmbinare la stânga și la dreapta), - „cură orizontală lungă” „̶”U+0336(̶)
  11. suprapunerea unui punct printr-un pas înapoi în ASCII (␈.) în Unicode este reprezentată de simbolul sub formă de punct combinabil „̣”U+0323(̣)
  12. pentru divizare ( a+b ∕ c+d cu control explicit (în afara Unicode) al plasării superscriptului și indicelui) se recomandă operația „∕”U+2215(∕); pentru fracții numerice pure cu control implicit (unicode) al poziționării superscriptului și indicelui (12⁄34) — caracter combinabil cu bara de fracțiuniU+2044 ⁄(⁄)
  13. Suprapunerea unei bare oblice inverse în ASCII (␈/) în Unicode este reprezentată de caracterul slash scurt combinabil „̷”U+0337(̷) sau „slash lung” „̸”U+0338(̸)
  14. Stilurile aldine prin suprapunerea unei cifre pe ea însăși prin trecerea înapoi în ASCII (0␈0 → 0 ) în Unicode sunt redate prin caractere din intervalul „𝟎”U+1D7CE(ퟎ)—"𝟗"U+1D7D7(ퟗ)
  15. Stilurile aldine prin suprapunerea unei litere pe ea însăși printr-un pas înapoi în ASCII (A␈A → A ) în Unicode sunt reprezentate de caractere din intervalul „𝐀”U+1D400(퐀)—"𝐙"U+1D419(퐙)
  16. depășirea barei oblice inverse în ASCII (␈\) în Unicode este reprezentată de caracterul combinabil „backslash” „⃥”U+20E5(⃥)
  17. ca superscript garantat, utilizați secvența „spațiu care nu se rupe, circumflex combinabil” „ ̂”U+00A0 U+0302( ̂) sau circumflexul pozițional „ˆ”U+02C6 ˆ(ˆ)
  18. Suprapunerea transportului printr-un pas înapoi în ASCII (␈^) în Unicode este reprezentată de caracterul circumflex combinat „̂”U+0302(̂)
  19. suprapunerea unei liniuțe de subliniere printr-un pas înapoi în ASCII (␈_) în Unicode este reprezentată de un caracter combinabil „macron de mai jos” (fără îmbinare orizontală) „̱”U+0331(̱) sau „subliniere” (cu andocare pe orizontală) „̲”U+0332(̲)
  20. suprapunerea unui mormânt prin pas înapoi în ASCII (␈`) în Unicode este reprezentată de caracterul „mormânt” combinat „̀”U+0300(̀)
  21. Stilurile aldine prin suprapunerea unei litere pe ea însăși printr-un pas înapoi în ASCII (a␈a → a ) în Unicode sunt reprezentate de caractere din intervalul „𝐚”U+1D41A(퐚)—"𝐳"U+1D433(퐳)
  22. Suprapunerea ASCII backspace (␈|) în Unicode este reprezentată de caracterul combinat „⃒”U+20D2(⃒) sau „bară verticală scurtă” „⃓”U+20D3(⃓)
  23. ca superscript, utilizați secvența „spațiu care nu se rupe, tilde combinabile” „̃”U+00A0 U+0303( ̃) sau tilde mică ˜U+02DC(˜), ca linie de mijloc - operația matematică „∼”U+223C ∼(∼)
  24. Suprapunerea unei tilde prin pas înapoi în ASCII (␈~) în Unicode este reprezentată de caracterul tilde combinabil „̃”U+0303(̃)

Link -uri