Personaje de control

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 12 februarie 2021; verificările necesită 11 modificări .

Caracterele de control  sunt caractere din codificare cărora nu li se atribuie o reprezentare grafică, dar sunt folosite pentru a controla dispozitivele, a organiza transferul de date și în alte scopuri.

În prezent , formatele de fișiere , limbaje de control al dispozitivului (cum ar fi Postscript ) și protocoalele de rețea sunt utilizate în aceste scopuri . Prin urmare, multe caractere de control acum fie nu sunt folosite deloc, fie nu sunt folosite în scopul propus.

Standardul POSIX necesită doar opt caractere de control - \0, \a, \b, \t, \n, \v, \f, \r (vezi setul de caractere portabil ).

Caractere de control ASCII

În 1963, a fost adoptată prima versiune a tabelului ASCII , care definea 29 de caractere de control, dintre care majoritatea erau în intervalul 00-1F, cu excepția caracterelor ACK, ESC și DEL. În revizuirea din 1967, caracterele ACK și ESC au fost mutate în gama principală, iar literele mici le-au luat locul.

Caracterele de control ASCII au fost menite să controleze funcționarea teletipurilor și a terminalelor video și au fost introduse pe ele prin combinații cu cheia Ctrl, care resetează bitul 6 din codul cheii introduse. În sistemele informatice moderne, nicăieri, cu excepția emulatoarelor de terminale, nu este este posibilă introducerea directă a acestor caractere (cu excepția filelor și a fluxurilor de rând). ) și majoritatea caracterelor de control enumerate nu sunt utilizate.

Număr titlu englezesc nume rusesc
Comandă rapidă de la tastatură [1 ]

secvență de evadare
Scop
0x00 NUL caracter gol ^@ \0 Acest simbol nu face nimic. Unele terminale îl afișează ca spațiu, dar acest lucru este incorect. Adesea, NULL este folosit pentru a marca sfârșitul unui șir de caractere (de exemplu, în limbajul C ).
0x01 ÎNCEPUTUL TITURII începutul antetului ^A Utilizat în prezent în consola routerului Cisco.
0x02 ÎNCEPUTUL TEXTULUI începutul textului ^B Utilizat în prezent în consola routerului Cisco.
0x03 SFÂRȘIT DE TEXT sfârşitul textului ^C Când este tastat la terminal, este de obicei interpretat ca un semnal de întrerupere.
0x04 SFÂRȘITUL TRANSMISIEI sfârşitul transmisiei ^D Când este introdus la un terminal pe sisteme UNIX , este interpretat ca sfârșitul intrării. Dacă programul curent a preluat date de la terminal, atunci se termină imediat ce a procesat tot ce era înainte de caracterul ^D.
0x05 ANCHETĂ cerere ^E Folosit în comunicarea prin teletip . Ca răspuns, trebuia să primească șirul de identificare al dispozitivului de la distanță.
0x06 RECUNOAȘTE confirmarea ^F Folosit în comunicarea prin teletip .
0x07 CLOPOT semnal sonor ^G \A Dacă acest caracter este trimis către o imprimantă sau un terminal, nu se va imprima nimic, dar se va auzi un bip.
0x08 SPATE ÎN SPATE intoarce-te ^H \b Mută ​​poziția de imprimare înapoi cu un caracter. Pe imprimante, poate fi folosit pentru a suprapune un caracter peste altul, cum ar fi BS ^ = â . Când este tastat de la un terminal, este uneori folosit pentru a șterge caracterul precedent ("backspace").
0x09 TABULARE CARACTERE (tabulare orizontală) filă orizontală ^I \t Mută ​​poziția de imprimare la următorul opritor de tablă orizontală.
0x0A LINIE DE ALIMENTARE traducere de linie ^J \n Mută ​​poziția de imprimare în jos cu o linie (inițial fără întoarcere car ). Separă linii de fișiere text pe sistemele Unix .
0x0B TABULAREA LINII (tabulare verticală) filă verticală ^K \v Mută ​​poziția de imprimare la următorul opritor vertical. Pe terminale, acest caracter este de obicei echivalent cu o linie nouă.
0x0C FORM FEED flip de pagină, schimbare de pagină ^L \f Scoate pagina curentă și începe tipărirea de la următoarea. Când iese către terminal, acest caracter este de obicei echivalent cu o nouă linie, dar apăsarea ^L de pe tastatură poate șterge ecranul.
0x0D RETUR TRANSPORT Retur transport ^M \r Mută ​​poziția de imprimare în poziția cea mai din stânga (inițial fără un avans de linie ). Separă linii de fișiere text pe unele sisteme de operare (de exemplu , Mac OS , dar nu și pe Mac OS X ). În multe alte sisteme de operare ( CP / M , MS-DOS și Microsoft Windows ), o combinație de coduri de retur (CARRIAGE RETURN) și de avans de linie (LINE FEED) este utilizată pentru a separa linii - 0D 16 + 0A 16 , adică, în forma în care fișierul poate fi trimis direct la imprimantă.
0x0E SHIFT OUT (blocare-schimbarea unu) modul caracter național ^N În KOI-7 , pornește modul simboluri naționale. Activează modul caractere cu lățime dublă pe unele imprimante.
0x0F SHIFT IN (blocare-schift zero) modul normal ASCII ^O KOI -7 include modul latin. Activează modul caracter îngust pe unele imprimante.
0x10 ESCAPARE LINK DE DATE evadarea caracterelor de control (în text simplu) ^P Indică faptul că caracterul de control care îl urmează ar trebui tratat ca date, nu ca caracter de control.
0x11 DISPOZITIV CONTROL ONE Primul cod de control al dispozitivului ^Q Pe terminale, vă permite să continuați să scoateți date.
0x12 CONTROL DOI DISPOZIT Al doilea cod de control al dispozitivului ^R
0x13 CONTROLUL DISPOZITIVUL TREI Al treilea cod de control al dispozitivului ^S Pe terminale, întrerupe temporar (suspend) ieșirea datelor.
0x14 CONTROLUL DISPOZITIVUL PATRU Al 4-lea cod de control al dispozitivului ^T
0x15 RECUNOAȘTE NEGATIVE confirmare negativă ^U Folosit în comunicarea prin teletip .
0x16 IDLE SINCRON caracter gol pentru modul de transfer sincron ^V Unele linii de comunicație sunt proiectate în așa fel încât necesită transmisie continuă de date. Dacă nu este nimic de transmis, atunci acest simbol este transmis.
0x17 SFÂRȘIT BLOC DE TRANSMISIE sfârşitul blocului de date ^W
0x18 ANULARE anulare ^X Datele care vin înainte sunt incorecte. (De obicei, aceasta este o singură linie.)
0x19 SFÂRȘIT MEDIUL sfârşitul media ^Y A fost folosit, de exemplu, dacă se epuizează banda de perforare etc.
0x1A SUBSTITUI caracter de înlocuire ^Z Plasat în locul caracterelor ale căror valori s-au pierdut în timpul transmiterii. În CP/M și MS-DOS , a fost folosit pentru a marca sfârșitul fișierelor text și sfârșitul introducerii în consolă (deși caracterele ^C și ^D au fost destinate acestui lucru).
0x1B EVADARE Registrul alternativ nr. 2 (AP2) ^[ \e Indică faptul că caracterele care îl urmează au o altă semnificație decât cea definită în ASCII. De obicei, pornește secvențele de evacuare . Vezi și ANSI.SYS .
0x1C SEPARATOR DE INFORMAȚII PATRU (separator de fișiere) delimitator de date #4 (delimitator de fișiere) ^\
0x1D SEPARATOR DE INFORMAȚII TREI (separator de grup) separator de date #3 (separator de grup) ^]
0x1E SEPARATOR DE INFORMAȚII DOI (separator de înregistrări) separator de date #2 (separator de înregistrări) ^^ Aparent, a fost intenționat să separe înregistrările în baze de date , dar aproape niciodată nu este folosit pentru aceasta.
0x1F SEPARATOR DE INFORMAȚII ONE (separator de unități) separator de date #1 (separator de câmpuri) ^_ Aparent, a fost intenționat să separe câmpurile din bazele de date, dar aproape niciodată nu este folosit pentru asta.
0x7F ȘTERGE îndepărtare ^? Este destinat ciocanului de caractere perforate eronat pe benzi perforate cu șapte piste (deoarece este indicat prin perforarea găurilor în toate pistele), deci este echivalent cu un caracter gol (\0) acolo. Pe terminale, acesta poate fi generat apăsând fie butonul Backspace, fie butonul Delete.

Caractere de control ISO 8859

80 , CARACTER PADDING, caracter substituent.

81 , PRESETARE HIGH OCTET, reprezentare înalt octet.

82 , PAUZĂ PERMISĂ AICI, aici este permisă o întrerupere de linie.

83 , NO BREAK HERE, nicio ruptură de linie permisă aici.

84 , INDEX, index.

85 , RÂNDUL URMĂTOR, rândul următor. Traduce simultan linia și readuce poziția de imprimare la începutul liniei (echivalent cu \r\n).

86 , ÎNCEPTUL ZONEI SELECTATE, începutul selecției.

87 , SFÂRȘIT AL ZONEI SELECTATE

88 , SET TABULARE CARACTERE, setează opriri de tablă orizontale.

89 , TABULAREA PERSONAJELOR CU JUSTIFICARE, stabilirea pozițiilor orizontale ale filelor și alinierea.

8A , SET TABULARE LINIE, setați opritoare verticale.

8B , LINIE PARȚIALĂ ÎNTÂMPRE

8C , LINIE PARȚIALĂ ÎNAPOI, feed back parțial de linie.

8D , ALIMENTARE LINIE INVERSĂ

8E , SINGLE SHIFT DOUA, a doua valoare pentru următorul caracter.

8F , SINGUL SHIFT TREI, a treia valoare pentru următorul caracter.

90 , DEVICE CONTROL STRING, șir de control dispozitiv.

91 , UTILIZARE PRIVATA UNU, caracterul utilizatorului #1.

92 , UTILIZARE PRIVATĂ DOUA, caracterul utilizatorului #2.

93 , SETARE STARE TRANSMIT, setați modul de transfer.

94 , ANULARE CARACTER

95 , MESAJ AȘTEPTARE, există un mesaj.

96 , ÎNCEPERE ZONA PĂZITĂ

97 , CAPAT ZONA PAZURII

98 , START OF STRING, începutul șirului.

99 , INTRODUCATOR UN SINGUR CARACTER GRAFIC, următorul caracter este interpretat ca un grafic special.

9A , INTRODUCATOR UN SINGUR CARACTER, următorul caracter este interpretat ca un caracter de control.

9B , INTRODUCATOR SECVENȚĂ DE CONTROL, începutul secvenței de control. Acest caracter este de obicei echivalent cu Escape+[.

9C , TERMINATOR ȘIR, sfârșit de linie.

9D , COMANDA SISTEMUL DE OPERARE, comanda sistemului de operare.

9E , MESAJ DE CONFIDENTIALITATE, mesaj secret.

9F , COMANDA PROGRAM APLICAȚIE

Caractere de control Unicode

034F , COMBINATĂ GRAPHEME JOINER. Combinați caracterele din stânga și din dreapta (creați o ligatură ).

2008 , SPAȚIU DE PUNCTUAȚIE, spațiu lat de punctuație.

200B , SPAȚIU cu lățime zero, spațiu cu lățime zero . Se poate extinde atunci când este justificat.

200C , LĂȚIME ZERO NETABLĂR. Interzice formarea de ligaturi .

200D ZERO LĂȚIME JOINER. Permite formarea de ligaturi .

200E MARCĂ DE LA STÂNGA LA DREAPTA. Scrieți de la stânga la dreapta.

200F MARCĂ DE LA DREAPTA LA STÂNGA. Scrieți de la dreapta la stânga.

2028 , SEPARATOR DE LINIE, separator de linii. Separă rândurile de text, dar nu și paragrafele.

2029 , SEPARATOR PARAGRAF, separator paragraf. Separă paragrafele de text.

202A INCOPARE DE LA STÂNGA LA DREAPTA. Începutul textului de la stânga la dreapta în textul de la dreapta la stânga.

202B INCOPARE DE LA DREAPTA LA STÂNGA. Începutul textului de la dreapta la stânga în textul de la stânga la dreapta.

202C , FORMATARE DIRECȚIONALĂ POP. Sfârșitul textului lipit cu altă direcție.

202D ANULARE DE LA STÂNGA LA DREAPTA. Înlocuiți textul scris de la stânga la dreapta cu textul scris de la dreapta la stânga.

202E ANULARE DE LA DREAPTA LA STÂNGA. Înlocuiți textul scris de la dreapta la stânga cu textul scris de la stânga la dreapta.

2060 , WORD JOINER, conector de cuvinte.

2061 , FUNCTION APPLICATION, function application.

2063 , SEPARATOR INVIZIBIL, separator invizibil.

2066 , IZOLARE DE LA STÂNGA LA DREAPTA

2067 , IZOLARE DE LA DREAPTA LA STÂNGA, separator de la dreapta la stânga.

2068 , FIRST STRONG ISOLATE, primul separator ranforsat.

2069 , POP DIRECTIONAL ISOLATE, popular separator de direcție.

206A , INHIBIT SWAPPING SYMMETRIC, dezactivare simetric swap [2] .

206B , ACTIVARE SCHIMBARE SIMETRICĂ, activare comutare simetrică [2] .

206C , INHIBIT FORMAREA FORMEI ARABE, interzicerea modelării formei arabe [2] .

206D , ACTIVARE FORMARE ARABĂ [2] .

206E , FORME DE CIFRE NAȚIONALE [2] .

206F , FORME DE CIFRE NOMINALE, forma nominală a cifrei [2] .

FE00 ... FE0F , SELECTOR DE VARIAȚIE-1 ... 16, selecția variantei de stil nr. 1 ... nr. 16.

FEFF , SPAȚIU FĂRĂ RUpere cu lățime zero / MARCA COMANDĂ BYTE, spațiu neîntrerupt cu lățime zero / indicator pentru ordinea octetilor. Acest caracter este folosit pentru a indica faptul că fișierul dat este scris în UTF-16 sau UTF-32 cu un endian specific (deoarece nu există caracter FFFE, iar UTF-8 nu folosește octeții FE și FF). Folosirea acestui caracter ca spațiu fără lățime zero, în ciuda numelui său original „ZERO WIDTH NO-BREAK SPACE”, este depreciată; pentru aceasta există un simbol U+2060 (joiner de cuvinte).

FFF9, ANOTAȚIE INTERLINEARĂ ANCOR

FFFA, SEPARATOR DE ANOTAȚII INTERLINEAR

FFFB, TERMINATOR DE ANOTAȚIE INTERLINEARĂ

FFFC, PERSONAJ DE ÎNLOCUIRE A OBIECTULUI

FFFD , PERSONAJ DE ÎNLOCUIT, care înlocuiește caracterul . Folosit atunci când semnificația unui caracter este necunoscută sau nu poate fi exprimată în Unicode (vezi și caracterul 1A).

E0100 ... E01EF , SELECTOR VARIAȚIUNE-17 ... 256, selecția stilului nr. 17 ... nr. 256.

Note

  1. Pentru primele 32 de caractere, aceasta este o combinație Ctrlși taste cu un cod de caractere cu 64 mai mare decât codul caracterului de control.
  2. 1 2 3 4 5 6 Simbolul nu este recomandat pentru utilizare.

Link -uri