Fórum Ubuntu CZ/SK

Ostatní => Archiv => Téma založeno: Phoenix 12 Listopadu 2006, 13:52:07

Název: divné znaky z windows souborů
Přispěvatel: Phoenix 12 Listopadu 2006, 13:52:07
Ve Windows jsem si programoval html stránky a když jsem je zkopíroval do Ubuntu, české znaky se mi přepsaly na nečitelné. Vypadá to nějak takto:

nepøihlášené

Myslel jsem, že to je jen v zobrazení, ale když znaky přepíšu, už se uloží v pohodě. Bohužel bylo by zdlouhavé přepisovat tolik textu. Nevěděl by někdo jak to vyřešit? Používam gedit, ale dělá to třeba i v Screamu.
Název: divné znaky z windows souborů
Přispěvatel: DevilMuF 12 Listopadu 2006, 14:28:00
to bude zrejme kodovou strankou (win1250 x UTF-8). Ty stranky to bude chtit prevest na UTF-8, na woknech na to pouzivam PSPad (http://www.pspad.com/cz/), ale urcite bude existovat spousta programu co to umeji.
Název: divné znaky z windows souborů
Přispěvatel: Dan 12 Listopadu 2006, 15:08:15
Ubuntu používá jinou znakovou sadu (UTF-8)- nevím jak gedit, ale většina editorů (třeba Kate z Kubuntu) umožňuje vybrat znakovou sadu vstupního souboru. Ta bude u tebe nejspíše Win-1250. Jen (jestli si soubor budeš ukládat už s UTF-8) nezapomeň upravit hlavičky HTML souborů, pokud v nich máš kódovou stránku uvedenou. Zobrazovaly by se ti potom zase špatně na Webu. Druhou možností je prohnat soubory nějakým konverzním prográmkem, pokud jich máš hodně, je to rozhodně rychlejší.
Název: divné znaky z windows souborů
Přispěvatel: Ozo 12 Listopadu 2006, 16:38:17
No, taky dělám web stránky a měl jsem stejný problém. Zjistil jsem ale, že v html editoru Bluefish
http://bluefish.openoffice.nl/index.html
mi kódovaní zůstalo na win-1250, takže nemusím všechny dosud vytvořené html stránky konvertovat.
Název: divné znaky z windows souborů
Přispěvatel: Kamil Páral 13 Listopadu 2006, 13:15:38
stranky by se mely psat primo v utf-8, v nicem jinem. potom bude mit kdokoli jinej (treba na windows, ale v jine zemi) problem je upravit. dost bych ti doporucoval prekonvertovat vsechny stranky z win-1250 kodovani do univerzalniho UTF-8. muzes na to pouzit prikazy recode, iconv nebo cstocs (jsou dostupne jako balicky, staci nainstalovat)

potom napriklad
$ recode 1250..utf8 stranka.html

samozrejme do dane html stranky musis pridat hlavicku oznacujici kodovani stranky. ted tam mas zrejme win-1250, pokud tam tu hlavicku nemas, tak je to dost zacatecnicka chyba. tuto hlavicku tedy zmenis na utf-8. viz treba me stranky, podivej se na ne a nech si zobrazit zdrojovy kod.
Název: divné znaky z windows souborů
Přispěvatel: Stepan 13 Listopadu 2006, 16:23:53
Nic neni treba prevadet, pokud do hlavicky html souboru uvedes, v jakem kodovani je dana stranka. Pokud to uvedeno neni, tak se pouzije vychozi nastaveni prohlizece. Ve Firefoxu je to v Upravy->predvolby, zalozka obsah, sekce pisma a barvy -> tlacitko rozsirene a pak si muzes vybrat defaultni kodovani.

V hlavicce html souboru (...) musi byt
Kód: [Vybrat]
pricemz iso-8859-2 muzes nahradit utf-8 nebo treba i windows-1250

Idealni je pouzivat iso, protoze je to mezinarodne uznavana norma. Jo a jeste neco: samotny zdrojovy html soubor musi byt samozrejme ve stejnem kodovani, jako ma uvedeno v hlavicce.

Takze existuje nekolik variant reseni:
1. dopsat do hlavicek souboru, ze jsou v kodovani windows-1250
2. zkonvertovat (treba pomoci iconv) soubory do utf-8, nebo iso-8859-2 a dopsat to do hlavicky.

Druhe reseni je obtiznejsi, ale clovek pak aspon dodrzuje stadrardy a neprizpusobuje se vymyslum Microsoftu. Pokud si ale clovek zvykne psat validni stranky a dodrzovat normy, tak to zadna prace navic neni
Název: divné znaky z windows souborů
Přispěvatel: Kamil Páral 13 Listopadu 2006, 23:07:39
klaudy, myslim ze jsi nepochopil problem. podle me autorovi vlakna vadi, ze kdyz otevre soubor v editoru (napr. gedit), ze tam je cinskej caj, a tudiz nejde upravovat. a to pripsanim hlavicky nezpravis. lepsi je vsechno zkonvertovat do utf-8. utf-8 soubory se daji upravovat i v notepadu na win.

jinak NENI PRAVDA, ze idealni je pouzivat iso. jedina mozna a idealni varianta je UTF-8, ktere boura vsechny bariery s kodovanim znaku a je resenim na tyto palcive problemy. vsude se na UTF-8 prechazi, a doufam ze brzo nic jineho nebude, a nebudou ani zadne dalsi problemy s kodovanim znaku. unicode je naprosto nejperspektivnejsi varianta.
Název: divné znaky z windows souborů
Přispěvatel: Poborskiii 13 Listopadu 2006, 23:18:31
Já jsem kdesi četl, že Windows XP používají vespod kódování UTF-8, kdežto navenek k uživateli lokální kódování a vždy se to mezi těmi vrstvami překládá sem a tam. Ale netuším, zda se to dá přepnout tak, aby defaultně bylo i navrch UTF-8. Problémem ale je, že díky tomuto typicky přiblblému mrkvosoftímu přístupu není dostatek aplikací pro Windows, které by uměli pracovat v či s UTF-8.  Např. Notepad ve Windows to umí, ale zkuste najít nějaký takový externí textový editor (taková ta "vylepšení Notepadu"), jenže téměř nenajdete a když, tak funguje blbě.
Název: divné znaky z windows souborů
Přispěvatel: Pavelp 14 Listopadu 2006, 06:27:55
Citace: Ripper
jinak NENI PRAVDA, ze idealni je pouzivat iso. jedina mozna a idealni varianta je UTF-8, ktere boura vsechny bariery s kodovanim znaku a je resenim na tyto palcive problemy. vsude se na UTF-8 prechazi, a doufam ze brzo nic jineho nebude, a nebudou ani zadne dalsi problemy s kodovanim znaku. unicode je naprosto nejperspektivnejsi varianta.
OT. Prosel jsem kodovanim bezdia (to byly casy) pres kodovani Kamenickych (mozna ani nekdo nebude znat) pres cp 852, latin2, iso 88592, win1250 az k utf8. Nikdy to nebylo dodelane, vzdycky se ty kody "krizily" / jeden koncil, druhy zacinal. MOZNA to u utf8 skonci. Ale to ja tu uz nebudu ......
Název: divné znaky z windows souborů
Přispěvatel: Ozo 14 Listopadu 2006, 15:57:18
Tak jsem zjistil že v Bluefishi jde nejen bezproblémů psát v kódování Win-1250, ale jde tam i velice snadně konvertovat na UTF-8 (Dokument - Kódování - UTF-8). A všechno hezky GUI, takže nemusíš ani použít konzoli a pak zdlouhavě přepisovat informace o kódování v hlavičce stránky, protože to za tebe Bluefish při konverzi udělá. Jak snadné :)
Název: divné znaky z windows souborů
Přispěvatel: Stepan 14 Listopadu 2006, 18:03:00
Ripper: jo, diky za upresneni... Spatne jsem si precet puvodni dotaz :)
Název: divné znaky z windows souborů
Přispěvatel: Kamil Páral 14 Listopadu 2006, 19:25:47
Citace: Poborskiii
Např. Notepad ve Windows to umí, ale zkuste najít nějaký takový externí textový editor (taková ta "vylepšení Notepadu"), jenže téměř nenajdete a když, tak funguje blbě.
Notepad2
Ale je pravda, ze pristup MS k tomuto je naprosto priserny, a zpusobuje strasny problemy. Napriklad pri zobrazovani titulku k filmum. Ani ty novy zasrany Visty nepouzivaji pokud se nemylim defaultne unicode, ale zas windows-1250. demence na n-tou.
Název: divné znaky z windows souborů
Přispěvatel: banter 29 Června 2007, 12:42:09
zkus spustit gedit v konzoli
Kód: [Vybrat]
gedit --encoding=windows-1250 tvuj_souborpro GUI postupuj podle návodu na wiki (http://wiki.ubuntu.cz/Kódování_znaků?highlight=%281250%29#head-6a4fe8f963cd30df22dc8a664b1aa8229ba6d524)