Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Obecná podpora => Téma založeno: iX 31 Března 2008, 07:17:03

Název: Kódování v konfiguračních souborech (K)Ubuntu.
Přispěvatel: iX 31 Března 2008, 07:17:03
Hoj! :)
  Jestli jsem to dobře pochopil, (K)Ubuntu používá jako výchozí kódování UTF-8 (a konec řádku v textových souborech typu UNIX). Ve widlích se používá cp1250 nebo co (konec řádku DOS/Windows).
  Vzhledem ke Zpětné kompatibilitě s Windows ;D ;D potřebuji mít v textovém editoru (Kate) nastaveno "Otevírat soubory" v kódování CodePage 1250 a konec řádku DOS/Windows.
  Pro editaci systémových souborů Linuxu (menu.lst, fstab, xorg.conf, sources.conf. ...) používám vnitřní editor Krusaderu s původním nastavením (UTF-8 / UNIX).

  Co když:  - se přehmátnu a z-edituju nějaký takovýto důležitý soubor v Kate? Rozpozná pak Linux widelní kódování a konec řádku? Nebo uvidí "kaši" rozsypanyho čaje a vše bude v pr?
 
Název: Re: Kódování v konfiguračních souborech (K)Ubuntu.
Přispěvatel: Martin Kiklhorn 31 Března 2008, 08:47:51
třeba znaky 1234567890ř + konec řádky vypadají hexa následovně
1250+crlf = 31323334353637383930F80D0A
utf-8+lf   = 31323334353637383930C5990A

Pokud je použit formát windows, nebo linux tak prvních ascii 128 znaků má stejnou reprezentaci. Pokud ten který soft kterému konfigurák paří si dokáže poradit s koncem řádku 0D0A (windows), samotné 0D (Mac), nebo samotné 0A (linux) tak problém při použití základní znakové sady nenastane. Bude to záviset soft od softu.
Rozsypání může nastat pokud jsou použity znaky s ascii>128 (třeba české) a soft počítá s jinou znakovou sadou (utf-8 je má kódovány dvoubajtově, většina ostatních kódování jednobajtově a netuším zda vůbec existuje nějaký jednoduchý způsob jak analyzovat zda jde o jedno nebo dvoubajtovou znakovou sadu)
Teď prakticky - v linuxu edituji hlavně konfiguráky a windowsovské readme soubory:
Pokud bych potřeboval editaci win + linux textových souborů tak bych si asi nastavil kódování 1250 + LF.
Linux - protože češtinu v konfigurákách nepoužívám (možná v komentářích - v nich by mi rozsypaný čaj tolik v případě přehmatu nevadil) tak bych si byl jistý že konce řádků mám správně.
Ve windows by mi konce znaků pouze LF také zřejmě nevadili (pokud by to nebyly konfiguráky, ale soubory pro lidi - používám ve win pspad který s tím nemá problém (asi stejně jako všechno kromě notepadu :-) A čeština by byla OK.