iconv este un utilitar UNIX (și o bibliotecă cu același nume ) pentru conversia textului dintr-o codificare în alta. Portat și pe Windows.
Utilitarul iconv convertește textul dintr-o codificare în alta. Codificarea de intrare este setată cu tasta -f, iar codificarea de ieșire cu tasta -t. Oricare dintre aceste codificări este implicită la localitatea sistemului. Toate fișierele de intrare sunt citite pe rând, dacă parametrul fișierului de intrare nu este specificat, atunci este utilizată intrarea standard , iar textul convertit este scos la ieșire standard .
Când este dată opțiunea -c, caracterele care nu pot fi convertite sunt pur și simplu eliminate. În caz contrar, atunci când apare o astfel de eroare, programul se blochează .
Când este dată opțiunea -s, nu sunt tipărite mesaje de eroare.
Comutatorul -l afișează o listă de codificări disponibile.
Următorul script găsește toate fișierele din directorul curent cu extensia *.java, le recodează în UTF-8 și copiază rezultatul în directorul res:
mkdir res find -maxdepth 1 -iname "*.java" -type f -exec bash -c "iconv -c -f WINDOWS-1251 -t UTF-8 {} > ./res/{}" \;Recodificarea tuturor fișierelor dintr-un director cu înlocuirea lor:
pentru i în * ; do iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; TerminatRecodificare recursiva a tuturor fișierelor de tipul necesar (în exemplu - txt):
găsi. -nume '*.txt' | în timp ce citesc i ; do iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; TerminatRecodificarea recursiv a tuturor fișierelor html:
# !/bin/sh find . -type f -name '*.htm' -o -name '*.html' | în timp ce citesc , fac eco $i iconv -f WINDOWS-1251 -t UTF-8 " $i " > tmp mv -f tmp " $i " terminatUrmătorul set de scripturi găsește toate fișierele din directorul curent cu extensia *.txt, recodifică în CP1251 din KOI8-R :
all.cmd:
pentru / R %% i în ( . ) apelați txt.cmd %% itxt.cmd:
setați cd2 = %cd% cd %1 pentru %% j în ( *.txt ) apelați % cd2 % \iconv2.cmd %% j cd %cd2%iconv2.cmd:
iconv -c -f KOI8-R -t CP1251 %1 > câștigă. %1 din %1 redenumiți câștig. %1 %1Alt mod (prin cmd):
Înainte de a executa această comandă, trebuie să adăugați calea către programul iconv.exe la variabila de mediu Path:
pentru %% i în ( *.txt ) do iconv -f cp1251 -t utf-8 " %% i" > utf8/ %% iComanda va recoda toate fișierele cu extensia „txt” și va pune fișierele recodate într-un folder utf8 pre-creat.
Comenzi Unix | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
|
Codificarea caracterelor | |
---|---|
Codificări istorice | comp. suplimentare semafor (Makarov) morse Bodo MTK-2 comp. 6 biți SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
reprezentare modernă pe 8 biți | simboluri ASCII non-ASCII Pagini de cod pe 8 biți chirilic KOI-8 Codificare de bază MacCyrillic ISO 8859 1 (lat.) 2 3 patru 5 (chir.) 6 7 opt 9 zece unsprezece 12 13 paisprezece 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM și DOS 437 850 852 855 866 „alternativă” MIC |
Multiocteți | tradiţional DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 lista de caractere chirilic |
interfața cu utilizatorul dispunerea tastaturii local traducere de linie font transliterare fonturi personalizate utilitati iconv record |