Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: Kódování v konfiguračních souborech (K)Ubuntu.  (Přečteno 1276 krát)

iX

  • Aktivní člen
  • *
  • Příspěvků: 469
Kódování v konfiguračních souborech (K)Ubuntu.
« kdy: 31 Března 2008, 07:17:03 »
Hoj! :)
  Jestli jsem to dobře pochopil, (K)Ubuntu používá jako výchozí kódování UTF-8 (a konec řádku v textových souborech typu UNIX). Ve widlích se používá cp1250 nebo co (konec řádku DOS/Windows).
  Vzhledem ke Zpětné kompatibilitě s Windows ;D ;D potřebuji mít v textovém editoru (Kate) nastaveno "Otevírat soubory" v kódování CodePage 1250 a konec řádku DOS/Windows.
  Pro editaci systémových souborů Linuxu (menu.lst, fstab, xorg.conf, sources.conf. ...) používám vnitřní editor Krusaderu s původním nastavením (UTF-8 / UNIX).

  Co když:  - se přehmátnu a z-edituju nějaký takovýto důležitý soubor v Kate? Rozpozná pak Linux widelní kódování a konec řádku? Nebo uvidí "kaši" rozsypanyho čaje a vše bude v pr?
 

Martin Kiklhorn

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • Závislák
  • ******
  • Příspěvků: 4807
  • グーグル!ご存知ですか?
    • HEJ
Re: Kódování v konfiguračních souborech (K)Ubuntu.
« Odpověď #1 kdy: 31 Března 2008, 08:47:51 »
třeba znaky 1234567890ř + konec řádky vypadají hexa následovně
1250+crlf = 31323334353637383930F80D0A
utf-8+lf   = 31323334353637383930C5990A

Pokud je použit formát windows, nebo linux tak prvních ascii 128 znaků má stejnou reprezentaci. Pokud ten který soft kterému konfigurák paří si dokáže poradit s koncem řádku 0D0A (windows), samotné 0D (Mac), nebo samotné 0A (linux) tak problém při použití základní znakové sady nenastane. Bude to záviset soft od softu.
Rozsypání může nastat pokud jsou použity znaky s ascii>128 (třeba české) a soft počítá s jinou znakovou sadou (utf-8 je má kódovány dvoubajtově, většina ostatních kódování jednobajtově a netuším zda vůbec existuje nějaký jednoduchý způsob jak analyzovat zda jde o jedno nebo dvoubajtovou znakovou sadu)
Teď prakticky - v linuxu edituji hlavně konfiguráky a windowsovské readme soubory:
Pokud bych potřeboval editaci win + linux textových souborů tak bych si asi nastavil kódování 1250 + LF.
Linux - protože češtinu v konfigurákách nepoužívám (možná v komentářích - v nich by mi rozsypaný čaj tolik v případě přehmatu nevadil) tak bych si byl jistý že konce řádků mám správně.
Ve windows by mi konce znaků pouze LF také zřejmě nevadili (pokud by to nebyly konfiguráky, ale soubory pro lidi - používám ve win pspad který s tím nemá problém (asi stejně jako všechno kromě notepadu :-) A čeština by byla OK.
Jsou ve vašem dotazu OPRAVDU VŠECHNY vám dostupné informace o problému?
Linux user since 2007-10-11, Registered #456007
Virtual
| Distribuce
~/slozka znamená /home/"vase jmeno"/slozka
6521 69DE 0F34 FCBC FB1D  DE76 360E 52B2 F71A B8E8

 

Provoz zaštiťuje spolek OpenAlt.