KOI-8 ( cod pentru schimb și informații , 8 biți), KOI8 este o pagină de coduri ASCII pe opt biți compatibilă . Conceput pentru a codifica litere din alfabetul chirilic . A fost folosit pe scară largă ca principală codificare rusă în sistemele de operare compatibile cu Unix și în e-mail , dar mai aproape de 2010 , odată cu răspândirea Unicode , intră treptat în neutilizare.
Există, de asemenea, o versiune pe șapte biți a codificării care nu este pe deplin compatibilă cu ASCII - KOI-7 . KOI-7 și KOI-8 sunt descrise în GOST 19768-74, acum dispărut.
Dezvoltatorii lui KOI-8 au plasat caracterele alfabetului rus în partea superioară a tabelului de coduri, astfel încât pozițiile caracterelor chirilice să corespundă omologilor lor fonetici din alfabetul englez din partea de jos a tabelului. Aceasta înseamnă că dacă în textul scris în KOI-8, pentru fiecare caracter, se scoate un bit din stânga, atunci se va obține un text relativ lizibil, similar transliterației . De exemplu, cuvintele „Text rusesc” vor deveni „rUSSKIJ tEKST”. Din această cauză, caracterele chirilice nu sunt în ordine alfabetică.
Există mai multe variante de codificare KOI-8 pentru diverse alfabete chirilice care extind anumite coduri (gama totală de 192-255 cu 32 de litere rusești în două cazuri rămâne neschimbată în toate variantele). Alfabetul rus este descris în codificarea KOI8-R , ucraineană - în KOI8-U , tadjik - în KOI8-T.
În anii 1990, KOI8-R a devenit standardul de facto pentru codificarea chirilicelor ruse pe sisteme de operare și e- mail asemănătoare UNIX . Autorul acestei codificări ( RFC 1489 ) Andrey Chernov a lucrat în compania Demos ( rețeaua Relcom ) la începutul anilor 1990 și a fost direct implicat în lansarea și ajustarea primului canal de internet între Rusia și țările occidentale . KOI-8 a devenit prima codificare standardizată rusă de pe Internet.
IETF a aprobat mai multe RFC-uri privind opțiunile de codificare KOI-8:
IANA a înregistrat codificări în lista sa.
Standardul RFC 1489 impune prezența caracterelor grafice „cutie” ( pseudografice ), cu toate acestea, această cerință este rareori îndeplinită.
Pe Microsoft Windows, lui KOI8-R i se atribuie codul de pagină 20866, KOI8-U este 21866.
Începutul tabelului de codificare ( latină ) corespunde în totalitate codării ASCII .
În tabelele de mai jos, numerele de sub litere indică codul hexazecimal Unicode al literei .
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
opt. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
²B2 _ |
B7 _ |
÷ F7 |
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
yo 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
╜255C _ |
Nr. 255D |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
Nr. 256A |
Nr. 256B |
╬ 256C |
© A9 |
C. |
yu 44E |
un 430 |
b 431 |
c 446 |
d 434 |
e 435 |
f 444 |
g 433 |
x 445 |
și 438 |
439 _ |
la 43A |
l 43B |
m 43C |
n 43D |
aproximativ 43E |
D. |
n 43F |
eu 44F |
p 440 |
din 441 |
t 442 |
la 443 |
f 436 |
în 432 |
b 44C |
s 44B |
s 437 |
sh 448 |
e 44D |
w 449 |
h 447 |
b 44A |
E. |
Yu 42E |
A 410 |
B 411 |
C 426 |
D 414 |
E 415 |
F 424 |
G 413 |
X 425 |
și 418 |
Y 419 |
K 41A |
L 41B |
M 41C |
H 41D |
Despre 41E |
F. |
P 41F |
Am 42F |
R 420 |
C 421 |
T 422 |
423 _ |
F 416 |
B 412 |
b 42c |
S 42B |
W 417 |
SH 428 |
E 42D |
Shch 429 |
Ch 427 |
b 42A |
Sunt afișate doar rândurile de tabel care nu se potrivesc, deoarece totul se potrivește.
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
yo 451 |
454 USD |
╔ 2554 |
eu 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
Nr. 255D |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
eu 406 |
407 lire sterline |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
Nr. 256A |
Ґ 490 |
╬ 256C |
© A9 |
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
yo 451 |
454 USD |
╔ 2554 |
eu 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
¢ 45E |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
eu 406 |
407 lire sterline |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
Nr. 256A |
Ґ 490 |
Î 40E |
© A9 |
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
opt. | - 493 |
497 _ |
49B _ |
49D _ |
n 4A3 |
- 4AF |
- 4B1 |
h 4B3 |
ҷ 4B7 |
nr. 4B9 |
h 4BB |
▀ 2580 |
4D9 _ |
ӣ 4E3 |
4E9 _ |
ӯ 4Eo |
9. | 492 _ |
496 _ |
K 49A |
49C _ |
Ң 4A2 |
- 4AE |
Ұ 4B0 |
- 4B2 |
- 4B6 |
- 4B8 |
4BA _ |
⌡ 2321 |
4D8 _ |
Ӣ 4E2 |
Ө 4E8 |
4EE _ |
A. | A0 |
452 USD |
-453 _ |
yo 451 |
454 USD |
* 455 |
eu 456 |
457 _ |
458 USD |
459 _ |
њ 45A |
ћ 45B |
ќ 45C |
491 _ |
¢ 45E |
џ 45F |
b. | nr. 2116 |
402 € |
Ѓ 403 |
Yo 401 |
Є 404 |
S 405 |
eu 406 |
407 lire sterline |
408 GBP |
409 lire sterline |
Њ40A _ |
40 de miliarde de lire sterline |
40C _ |
Ґ 490 |
Î 40E |
Џ 40F |
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
203A}} | Nr. 045A |
ќ 045C |
ћ 045B |
џ 045F | ||||||||||||
Î 040E |
© 00A9 |
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
00A0 |
0452 USD |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
eu 0456 |
ї 0457 |
0458 USD |
љ 0459 |
Nr. 045A |
ћ 045B |
ќ 045C |
00AD |
¢ 045E |
џ 045F |
b. |
nr. 2116 |
0402 € |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
0407 £ |
0408 GBP |
Љ 0409 |
Њ 040A |
040 miliarde GBP |
Nr. 040C |
¤ 00A4 |
Î 040E |
P 040F |
Codificarea KOI8-Unified (KOI8-F) a fost propusă de Fingertip Software [1] .
.0 | .unu | .2 | .3 | .patru | .5 | .6 | .7 | .opt | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
opt. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
' 2018 |
' 2019 |
„ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
00B7 _ |
¤ 00A4 |
A. |
00A0 |
0452 USD |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
eu 0456 |
ї 0457 |
0458 USD |
љ 0459 |
Nr. 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
¢ 045E |
џ 045F |
b. |
nr. 2116 |
0402 € |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
0407 £ |
0408 GBP |
Љ 0409 |
Њ 040A |
040 miliarde GBP |
Nr. 040C |
Ґ 0490 |
Î 040E |
P 040F |
În unele țări CMEA, au fost create modificări ale KOI-8 pentru variantele naționale ale alfabetului latin . Ideea de bază a fost aceeași - atunci când „tăiem” al optulea bit, textul ar trebui să rămână mai mult sau mai puțin clar.
Codificarea caracterelor | |
---|---|
Codificări istorice | comp. suplimentare semafor (Makarov) morse Bodo MTK-2 comp. 6 biți SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
reprezentare modernă pe 8 biți | simboluri ASCII non-ASCII Pagini de cod pe 8 biți chirilic KOI-8 Codificare de bază MacCyrillic ISO 8859 1 (lat.) 2 3 patru 5 (chir.) 6 7 opt 9 zece unsprezece 12 13 paisprezece 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM și DOS 437 850 852 855 866 „alternativă” MIC |
Multiocteți | tradiţional DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 lista de caractere chirilic |
interfața cu utilizatorul dispunerea tastaturii local traducere de linie font transliterare fonturi personalizate utilitati iconv record |