zagugli iconv .. nebo man iconv
iconv -f ISO-8859-2 -t UTF-8
iconv -f "různé mrskané češtiny" -t UTF-8
aneb: Jak poznat u TXT souboru, jaké je kódování?
Citace: compaq 02 Listopadu 2012, 13:47:05aneb: Jak poznat u TXT souboru, jaké je kódování?Nijak, jedině vyzkoušet. U češtiny ovšem připadá (za normálních okolností) v úvahu jen trojice ISO-8859-2, CP1250 (Win-1250) a UTF-8.
Dávková změna kódováníPomocí příkazu iconv nebo convmv je možné změnit kódování souborů např. z Win-1250 na UTF-8:Kód: [Vybrat]for F in $(find $1 -iname "*.html")do if [ -f $F ]; then iconv -f windows-1250 -t utf-8 $F > ${F}1 mv ${F}1 $F fidone
for F in $(find $1 -iname "*.html")do if [ -f $F ]; then iconv -f windows-1250 -t utf-8 $F > ${F}1 mv ${F}1 $F fidone
enca a.txt
enca -x utf8 a.txt
enca -c -x utf8 -l czech a.txt
Citace: Vojtěch Trefný 02 Listopadu 2012, 14:17:32Citace: compaq 02 Listopadu 2012, 13:47:05aneb: Jak poznat u TXT souboru, jaké je kódování?Nijak, jedině vyzkoušet. U češtiny ovšem připadá (za normálních okolností) v úvahu jen trojice ISO-8859-2, CP1250 (Win-1250) a UTF-8.No, možná tomu úplně tak nebude, na abclinuxu doporučují program enca nebo program file s přepínačem -i.
The Big Bang Theory S02E01.srt: text/plain; charset=unknown-8bit
A ten program file také jen odhaduje? Je škoda že není nějaké lepší řešení.
Určitě poradí google . Jinak i blbý notepad ve widlích umí uložit otevřený soubor v několika druzích kódování (ANSI, UTF-8, Unicode, Big Endian). Divil bych se, kdyby to linuxové editory neuměli.
Citace: beer 02 Listopadu 2012, 14:14:43Určitě poradí google . Jinak i blbý notepad ve widlích umí uložit otevřený soubor v několika druzích kódování (ANSI, UTF-8, Unicode, Big Endian). Divil bych se, kdyby to linuxové editory neuměli.I blbý notepad, je chytřejší než Gedit, protože otevřít soubor je základ.
Pozná to program, který to umí číst v hexa, tak jak je to uložené na disku.
Já jsem otevřel v Notepadu, vždy vše, za to v Geditu, málo co
CitaceJá jsem otevřel v Notepadu, vždy vše, za to v Geditu, málo co já mám osobně dobré zkušenosti s editorem v Xfce jmenuje se "mouse...." prostě něco s myší. Většinou kde gedit skončil, tady to šlo v pohodě
sudo apt-get install python-chardet
$ uchardet můj_soubormůj_soubor: utf-8 (confidence: 0.99)$ uchardet soubor_od_někoho_jinýho.txtsoubor_od_někoho_jinýho.txt: ISO-8859-2 (confidence: 0.80)