Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Obecná podpora => Téma založeno: Tomtom 02 Února 2017, 16:38:33

Název: Převod titulků v ASCII na UTF-8
Přispěvatel: Tomtom 02 Února 2017, 16:38:33
Ahoj,
mám anglické titulky .srt v ACSII (v příloze) a chci je převést na UTF8. Pokud je převedu (iconv, enca, recode, gedit, leafpad, gnome-subtitles, subtitleeditor,...) stále se tváří jako ASCII. Zkusil jsem i notepad++ pod wine, zkusíl jsem i několik online konvertorů.
Kód: [Vybrat]
enca *
test.srt: 7bit ASCII characters
  CRLF line terminators

Pokud je edituju (připíšu něco česky), tváří se jako "Doubly-encoded to UTF-8 from KOI-8_CS_2" případně "Unrecognized encoding".
Kód: [Vybrat]
enca *
test.srt:Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Doubly-encoded to UTF-8 from KOI-8_CS_2

Mimochodem nemám ubuntu ale debian wheezy a prostředí v cs_CZ.UTF-8, nevím co ještě relevantního bych měl uvést.

Nějaký nápad, kde je problém, v souboru nebo u mě? Nebo postup co se souborem udělat. Díky.
Název: Re:Převod titulků v ASCII na UTF-8
Přispěvatel: juwa2 02 Února 2017, 17:04:38
Tohle vyhovuje?
Název: Re:Převod titulků v ASCII na UTF-8
Přispěvatel: Tomtom 02 Února 2017, 17:31:01
Tohle vyhovuje?
Chtěl jsem se radovat, ale když soubor otevřu, připíšu třeba "č" (otvírám a ukládám jako utf8) zase je to zlé(tedy předpokládám, že to je zlé, tak nějak očekávám, že podobně pokažené kodování může dělat u přehrávání neplechu):

Kód: [Vybrat]
enca *
test_convert-počeštěný.srt: Universal transformation format 8 bits; UTF-8
Doubly-encoded to UTF-8 from KOI-8_CS_2
Název: Re:Převod titulků v ASCII na UTF-8
Přispěvatel: Myrmica 02 Února 2017, 17:58:45
Jen tak mimochodem, jak chceš převést titulky v prostém ASCII na UTF8? To přeci nejde, protože tabulka ASCII je obsažena v tabulce UTF8 a při převodu se nic nestane.
Musíš mít text napsaný v češtině aby enca byla schopna rozpoznat výchozí kódování. Pokud však je kódování souboru v UTF8 pak se defaultně převádí do kódování systému, tedy do UTF8 a zase se nic nestane... A aby byla enca schopna bezpečně určit výchozí znakovou sadu souboru potřebuje mít i dostatečné množství textu v daném kódování...
Název: Re:Převod titulků v ASCII na UTF-8
Přispěvatel: Tomtom 02 Února 2017, 18:14:03
...aby byla enca schopna bezpečně určit výchozí znakovou sadu souboru potřebuje mít i dostatečné množství textu v daném kódování...

V tom byl zakopaný pes. Zkoušel jsem to jen s pár písmeny, když vložím víc českého textu, už enca rozezná kodování správně.

Takže vyřešeno.
Děkuju všem!