Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: test charsetu souboru  (Přečteno 1682 krát)

null

  • Návštěvník
  • Příspěvků: 25
test charsetu souboru
« kdy: 12 Srpna 2010, 20:32:11 »
Zdravím,
potřebuji převést ve skriptu soubory z kódování windows-1250 do utf-8.
iconv -f WINDOWS-1250 -t UTF-8 "$soubor" udělá vše dobře, ale potřebuju otestovat, zda ten soubor je vážně ve 1250, pokud totiž narazí na UTF-8, tak mi ho totálně zničí.
Nevíte jak otestovat charset souboru?
Díky

GR!nCh

  • Návštěvník
  • Příspěvků: 22
Re: test charsetu souboru
« Odpověď #1 kdy: 12 Srpna 2010, 20:47:38 »
enca zjistí kódování souboru a enconv provede automatické překódování souboru do kódování, které je v prostředí nastaveno jako implicitní.
Ubuntu GNU/Linux @ Lenovo ThinkPad T61 14"

mka

  • Závislák
  • ***
  • Příspěvků: 1907
  • Chybovat je moje.
    • Příložany Cé Zet
Re: test charsetu souboru
« Odpověď #2 kdy: 12 Srpna 2010, 23:27:13 »
Zdravím,
potřebuji převést ve skriptu soubory z kódování windows-1250 do utf-8.
iconv -f WINDOWS-1250 -t UTF-8 "$soubor" udělá vše dobře, ale potřebuju otestovat, zda ten soubor je vážně ve 1250, pokud totiž narazí na UTF-8, tak mi ho totálně zničí.
Nevíte jak otestovat charset souboru?
Díky

Pokud soubor neobsahuje na začátku nějaký "příznak kódování", je nemožné jeho skutečné kódování nějak stoprocentně ověřit. Jediné, co je možné zjistit, je to, že v soubor obsahuje znaky, které jsou v nějakém konkrétním kódování netisknutelné. Tak to prostě je a nic s tím nenaděláš.
Kontrolní otázka: v jakém kódování je soubor, který sodou okolností neobsahuje jiné znaky než ascii? :-)

null

  • Návštěvník
  • Příspěvků: 25
Re: test charsetu souboru
« Odpověď #3 kdy: 12 Srpna 2010, 23:44:24 »
Děkuji moc,
odpověď na kontrolní otázku neznám, ale vim že utf-8 to nebude :-)

 

Provoz zaštiťuje spolek OpenAlt.