Caracterele de control sunt caractere din codificare cărora nu li se atribuie o reprezentare grafică, dar sunt folosite pentru a controla dispozitivele, a organiza transferul de date și în alte scopuri.
În prezent , formatele de fișiere , limbaje de control al dispozitivului (cum ar fi Postscript ) și protocoalele de rețea sunt utilizate în aceste scopuri . Prin urmare, multe caractere de control acum fie nu sunt folosite deloc, fie nu sunt folosite în scopul propus.
Standardul POSIX necesită doar opt caractere de control - \0, \a, \b, \t, \n, \v, \f, \r (vezi setul de caractere portabil ).
În 1963, a fost adoptată prima versiune a tabelului ASCII , care definea 29 de caractere de control, dintre care majoritatea erau în intervalul 00-1F, cu excepția caracterelor ACK, ESC și DEL. În revizuirea din 1967, caracterele ACK și ESC au fost mutate în gama principală, iar literele mici le-au luat locul.
Caracterele de control ASCII au fost menite să controleze funcționarea teletipurilor și a terminalelor video și au fost introduse pe ele prin combinații cu cheia Ctrl, care resetează bitul 6 din codul cheii introduse. În sistemele informatice moderne, nicăieri, cu excepția emulatoarelor de terminale, nu este este posibilă introducerea directă a acestor caractere (cu excepția filelor și a fluxurilor de rând). ) și majoritatea caracterelor de control enumerate nu sunt utilizate.
Număr | titlu englezesc | nume rusesc | Comandă rapidă de la tastatură [1 ] |
secvență de evadare |
Scop |
---|---|---|---|---|---|
0x00 | NUL | caracter gol | ^@ | \0 | Acest simbol nu face nimic. Unele terminale îl afișează ca spațiu, dar acest lucru este incorect. Adesea, NULL este folosit pentru a marca sfârșitul unui șir de caractere (de exemplu, în limbajul C ). |
0x01 | ÎNCEPUTUL TITURII | începutul antetului | ^A | Utilizat în prezent în consola routerului Cisco. | |
0x02 | ÎNCEPUTUL TEXTULUI | începutul textului | ^B | Utilizat în prezent în consola routerului Cisco. | |
0x03 | SFÂRȘIT DE TEXT | sfârşitul textului | ^C | Când este tastat la terminal, este de obicei interpretat ca un semnal de întrerupere. | |
0x04 | SFÂRȘITUL TRANSMISIEI | sfârşitul transmisiei | ^D | Când este introdus la un terminal pe sisteme UNIX , este interpretat ca sfârșitul intrării. Dacă programul curent a preluat date de la terminal, atunci se termină imediat ce a procesat tot ce era înainte de caracterul ^D. | |
0x05 | ANCHETĂ | cerere | ^E | Folosit în comunicarea prin teletip . Ca răspuns, trebuia să primească șirul de identificare al dispozitivului de la distanță. | |
0x06 | RECUNOAȘTE | confirmarea | ^F | Folosit în comunicarea prin teletip . | |
0x07 | CLOPOT | semnal sonor | ^G | \A | Dacă acest caracter este trimis către o imprimantă sau un terminal, nu se va imprima nimic, dar se va auzi un bip. |
0x08 | SPATE ÎN SPATE | intoarce-te | ^H | \b | Mută poziția de imprimare înapoi cu un caracter. Pe imprimante, poate fi folosit pentru a suprapune un caracter peste altul, cum ar fi BS ^ = â . Când este tastat de la un terminal, este uneori folosit pentru a șterge caracterul precedent ("backspace"). |
0x09 | TABULARE CARACTERE (tabulare orizontală) | filă orizontală | ^I | \t | Mută poziția de imprimare la următorul opritor de tablă orizontală. |
0x0A | LINIE DE ALIMENTARE | traducere de linie | ^J | \n | Mută poziția de imprimare în jos cu o linie (inițial fără întoarcere car ). Separă linii de fișiere text pe sistemele Unix . |
0x0B | TABULAREA LINII (tabulare verticală) | filă verticală | ^K | \v | Mută poziția de imprimare la următorul opritor vertical. Pe terminale, acest caracter este de obicei echivalent cu o linie nouă. |
0x0C | FORM FEED | flip de pagină, schimbare de pagină | ^L | \f | Scoate pagina curentă și începe tipărirea de la următoarea. Când iese către terminal, acest caracter este de obicei echivalent cu o nouă linie, dar apăsarea ^L de pe tastatură poate șterge ecranul. |
0x0D | RETUR TRANSPORT | Retur transport | ^M | \r | Mută poziția de imprimare în poziția cea mai din stânga (inițial fără un avans de linie ). Separă linii de fișiere text pe unele sisteme de operare (de exemplu , Mac OS , dar nu și pe Mac OS X ). În multe alte sisteme de operare ( CP / M , MS-DOS și Microsoft Windows ), o combinație de coduri de retur (CARRIAGE RETURN) și de avans de linie (LINE FEED) este utilizată pentru a separa linii - 0D 16 + 0A 16 , adică, în forma în care fișierul poate fi trimis direct la imprimantă. |
0x0E | SHIFT OUT (blocare-schimbarea unu) | modul caracter național | ^N | În KOI-7 , pornește modul simboluri naționale. Activează modul caractere cu lățime dublă pe unele imprimante. | |
0x0F | SHIFT IN (blocare-schift zero) | modul normal ASCII | ^O | KOI -7 include modul latin. Activează modul caracter îngust pe unele imprimante. | |
0x10 | ESCAPARE LINK DE DATE | evadarea caracterelor de control (în text simplu) | ^P | Indică faptul că caracterul de control care îl urmează ar trebui tratat ca date, nu ca caracter de control. | |
0x11 | DISPOZITIV CONTROL ONE | Primul cod de control al dispozitivului | ^Q | Pe terminale, vă permite să continuați să scoateți date. | |
0x12 | CONTROL DOI DISPOZIT | Al doilea cod de control al dispozitivului | ^R | ||
0x13 | CONTROLUL DISPOZITIVUL TREI | Al treilea cod de control al dispozitivului | ^S | Pe terminale, întrerupe temporar (suspend) ieșirea datelor. | |
0x14 | CONTROLUL DISPOZITIVUL PATRU | Al 4-lea cod de control al dispozitivului | ^T | ||
0x15 | RECUNOAȘTE NEGATIVE | confirmare negativă | ^U | Folosit în comunicarea prin teletip . | |
0x16 | IDLE SINCRON | caracter gol pentru modul de transfer sincron | ^V | Unele linii de comunicație sunt proiectate în așa fel încât necesită transmisie continuă de date. Dacă nu este nimic de transmis, atunci acest simbol este transmis. | |
0x17 | SFÂRȘIT BLOC DE TRANSMISIE | sfârşitul blocului de date | ^W | ||
0x18 | ANULARE | anulare | ^X | Datele care vin înainte sunt incorecte. (De obicei, aceasta este o singură linie.) | |
0x19 | SFÂRȘIT MEDIUL | sfârşitul media | ^Y | A fost folosit, de exemplu, dacă se epuizează banda de perforare etc. | |
0x1A | SUBSTITUI | caracter de înlocuire | ^Z | Plasat în locul caracterelor ale căror valori s-au pierdut în timpul transmiterii. În CP/M și MS-DOS , a fost folosit pentru a marca sfârșitul fișierelor text și sfârșitul introducerii în consolă (deși caracterele ^C și ^D au fost destinate acestui lucru). | |
0x1B | EVADARE | Registrul alternativ nr. 2 (AP2) | ^[ | \e | Indică faptul că caracterele care îl urmează au o altă semnificație decât cea definită în ASCII. De obicei, pornește secvențele de evacuare . Vezi și ANSI.SYS . |
0x1C | SEPARATOR DE INFORMAȚII PATRU (separator de fișiere) | delimitator de date #4 (delimitator de fișiere) | ^\ | ||
0x1D | SEPARATOR DE INFORMAȚII TREI (separator de grup) | separator de date #3 (separator de grup) | ^] | ||
0x1E | SEPARATOR DE INFORMAȚII DOI (separator de înregistrări) | separator de date #2 (separator de înregistrări) | ^^ | Aparent, a fost intenționat să separe înregistrările în baze de date , dar aproape niciodată nu este folosit pentru aceasta. | |
0x1F | SEPARATOR DE INFORMAȚII ONE (separator de unități) | separator de date #1 (separator de câmpuri) | ^_ | Aparent, a fost intenționat să separe câmpurile din bazele de date, dar aproape niciodată nu este folosit pentru asta. | |
0x7F | ȘTERGE | îndepărtare | ^? | Este destinat ciocanului de caractere perforate eronat pe benzi perforate cu șapte piste (deoarece este indicat prin perforarea găurilor în toate pistele), deci este echivalent cu un caracter gol (\0) acolo. Pe terminale, acesta poate fi generat apăsând fie butonul Backspace, fie butonul Delete. |
80 , CARACTER PADDING, caracter substituent.
81 , PRESETARE HIGH OCTET, reprezentare înalt octet.
82 , PAUZĂ PERMISĂ AICI, aici este permisă o întrerupere de linie.
83 , NO BREAK HERE, nicio ruptură de linie permisă aici.
84 , INDEX, index.
85 , RÂNDUL URMĂTOR, rândul următor. Traduce simultan linia și readuce poziția de imprimare la începutul liniei (echivalent cu \r\n).
86 , ÎNCEPTUL ZONEI SELECTATE, începutul selecției.
87 , SFÂRȘIT AL ZONEI SELECTATE
88 , SET TABULARE CARACTERE, setează opriri de tablă orizontale.
89 , TABULAREA PERSONAJELOR CU JUSTIFICARE, stabilirea pozițiilor orizontale ale filelor și alinierea.
8A , SET TABULARE LINIE, setați opritoare verticale.
8B , LINIE PARȚIALĂ ÎNTÂMPRE
8C , LINIE PARȚIALĂ ÎNAPOI, feed back parțial de linie.
8D , ALIMENTARE LINIE INVERSĂ
8E , SINGLE SHIFT DOUA, a doua valoare pentru următorul caracter.
8F , SINGUL SHIFT TREI, a treia valoare pentru următorul caracter.
90 , DEVICE CONTROL STRING, șir de control dispozitiv.
91 , UTILIZARE PRIVATA UNU, caracterul utilizatorului #1.
92 , UTILIZARE PRIVATĂ DOUA, caracterul utilizatorului #2.
93 , SETARE STARE TRANSMIT, setați modul de transfer.
94 , ANULARE CARACTER
95 , MESAJ AȘTEPTARE, există un mesaj.
96 , ÎNCEPERE ZONA PĂZITĂ
97 , CAPAT ZONA PAZURII
98 , START OF STRING, începutul șirului.
99 , INTRODUCATOR UN SINGUR CARACTER GRAFIC, următorul caracter este interpretat ca un grafic special.
9A , INTRODUCATOR UN SINGUR CARACTER, următorul caracter este interpretat ca un caracter de control.
9B , INTRODUCATOR SECVENȚĂ DE CONTROL, începutul secvenței de control. Acest caracter este de obicei echivalent cu Escape+[.
9C , TERMINATOR ȘIR, sfârșit de linie.
9D , COMANDA SISTEMUL DE OPERARE, comanda sistemului de operare.
9E , MESAJ DE CONFIDENTIALITATE, mesaj secret.
9F , COMANDA PROGRAM APLICAȚIE
034F , COMBINATĂ GRAPHEME JOINER. Combinați caracterele din stânga și din dreapta (creați o ligatură ).
2008 , SPAȚIU DE PUNCTUAȚIE, spațiu lat de punctuație.
200B , SPAȚIU cu lățime zero, spațiu cu lățime zero . Se poate extinde atunci când este justificat.
200C , LĂȚIME ZERO NETABLĂR. Interzice formarea de ligaturi .
200D ZERO LĂȚIME JOINER. Permite formarea de ligaturi .
200E MARCĂ DE LA STÂNGA LA DREAPTA. Scrieți de la stânga la dreapta.
200F MARCĂ DE LA DREAPTA LA STÂNGA. Scrieți de la dreapta la stânga.
2028 , SEPARATOR DE LINIE, separator de linii. Separă rândurile de text, dar nu și paragrafele.
2029 , SEPARATOR PARAGRAF, separator paragraf. Separă paragrafele de text.
202A INCOPARE DE LA STÂNGA LA DREAPTA. Începutul textului de la stânga la dreapta în textul de la dreapta la stânga.
202B INCOPARE DE LA DREAPTA LA STÂNGA. Începutul textului de la dreapta la stânga în textul de la stânga la dreapta.
202C , FORMATARE DIRECȚIONALĂ POP. Sfârșitul textului lipit cu altă direcție.
202D ANULARE DE LA STÂNGA LA DREAPTA. Înlocuiți textul scris de la stânga la dreapta cu textul scris de la dreapta la stânga.
202E ANULARE DE LA DREAPTA LA STÂNGA. Înlocuiți textul scris de la dreapta la stânga cu textul scris de la stânga la dreapta.
2060 , WORD JOINER, conector de cuvinte.
2061 , FUNCTION APPLICATION, function application.
2063 , SEPARATOR INVIZIBIL, separator invizibil.
2066 , IZOLARE DE LA STÂNGA LA DREAPTA
2067 , IZOLARE DE LA DREAPTA LA STÂNGA, separator de la dreapta la stânga.
2068 , FIRST STRONG ISOLATE, primul separator ranforsat.
2069 , POP DIRECTIONAL ISOLATE, popular separator de direcție.
206A , INHIBIT SWAPPING SYMMETRIC, dezactivare simetric swap [2] .
206B , ACTIVARE SCHIMBARE SIMETRICĂ, activare comutare simetrică [2] .
206C , INHIBIT FORMAREA FORMEI ARABE, interzicerea modelării formei arabe [2] .
206D , ACTIVARE FORMARE ARABĂ [2] .
206E , FORME DE CIFRE NAȚIONALE [2] .
206F , FORME DE CIFRE NOMINALE, forma nominală a cifrei [2] .
FE00 ... FE0F , SELECTOR DE VARIAȚIE-1 ... 16, selecția variantei de stil nr. 1 ... nr. 16.
FEFF , SPAȚIU FĂRĂ RUpere cu lățime zero / MARCA COMANDĂ BYTE, spațiu neîntrerupt cu lățime zero / indicator pentru ordinea octetilor. Acest caracter este folosit pentru a indica faptul că fișierul dat este scris în UTF-16 sau UTF-32 cu un endian specific (deoarece nu există caracter FFFE, iar UTF-8 nu folosește octeții FE și FF). Folosirea acestui caracter ca spațiu fără lățime zero, în ciuda numelui său original „ZERO WIDTH NO-BREAK SPACE”, este depreciată; pentru aceasta există un simbol U+2060 (joiner de cuvinte).
FFF9, ANOTAȚIE INTERLINEARĂ ANCOR
FFFA, SEPARATOR DE ANOTAȚII INTERLINEAR
FFFB, TERMINATOR DE ANOTAȚIE INTERLINEARĂ
FFFC, PERSONAJ DE ÎNLOCUIRE A OBIECTULUI
FFFD , PERSONAJ DE ÎNLOCUIT, care înlocuiește caracterul . Folosit atunci când semnificația unui caracter este necunoscută sau nu poate fi exprimată în Unicode (vezi și caracterul 1A).
E0100 ... E01EF , SELECTOR VARIAȚIUNE-17 ... 256, selecția stilului nr. 17 ... nr. 256.
Codificarea caracterelor | |
---|---|
Codificări istorice | comp. suplimentare semafor (Makarov) morse Bodo MTK-2 comp. 6 biți SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
reprezentare modernă pe 8 biți | simboluri ASCII non-ASCII Pagini de cod pe 8 biți chirilic KOI-8 Codificare de bază MacCyrillic ISO 8859 1 (lat.) 2 3 patru 5 (chir.) 6 7 opt 9 zece unsprezece 12 13 paisprezece 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM și DOS 437 850 852 855 866 „alternativă” MIC |
Multiocteți | tradiţional DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 lista de caractere chirilic |
interfața cu utilizatorul dispunerea tastaturii local traducere de linie font transliterare fonturi personalizate utilitati iconv record |