Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: null 12 Srpna 2010, 20:32:11
-
Zdravím,
potřebuji převést ve skriptu soubory z kódování windows-1250 do utf-8.
iconv -f WINDOWS-1250 -t UTF-8 "$soubor" udělá vše dobře, ale potřebuju otestovat, zda ten soubor je vážně ve 1250, pokud totiž narazí na UTF-8, tak mi ho totálně zničí.
Nevíte jak otestovat charset souboru?
Díky
-
enca zjistí kódování souboru a enconv provede automatické překódování souboru do kódování, které je v prostředí nastaveno jako implicitní.
-
Zdravím,
potřebuji převést ve skriptu soubory z kódování windows-1250 do utf-8.
iconv -f WINDOWS-1250 -t UTF-8 "$soubor" udělá vše dobře, ale potřebuju otestovat, zda ten soubor je vážně ve 1250, pokud totiž narazí na UTF-8, tak mi ho totálně zničí.
Nevíte jak otestovat charset souboru?
Díky
Pokud soubor neobsahuje na začátku nějaký "příznak kódování", je nemožné jeho skutečné kódování nějak stoprocentně ověřit. Jediné, co je možné zjistit, je to, že v soubor obsahuje znaky, které jsou v nějakém konkrétním kódování netisknutelné. Tak to prostě je a nic s tím nenaděláš.
Kontrolní otázka: v jakém kódování je soubor, který sodou okolností neobsahuje jiné znaky než ascii? :-)
-
Děkuji moc,
odpověď na kontrolní otázku neznám, ale vim že utf-8 to nebude :-)