Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.

Autor Téma: Převod titulků v ASCII na UTF-8  (Přečteno 1478 krát)

Tomtom

  • Návštěvník
  • *
  • Příspěvků: 84
  • Karma: +6/-0
    • Zobrazit profil
Převod titulků v ASCII na UTF-8
« kdy: 02 Únor 2017, 16:38:33 »
Ahoj,
mám anglické titulky .srt v ACSII (v příloze) a chci je převést na UTF8. Pokud je převedu (iconv, enca, recode, gedit, leafpad, gnome-subtitles, subtitleeditor,...) stále se tváří jako ASCII. Zkusil jsem i notepad++ pod wine, zkusíl jsem i několik online konvertorů.
Kód: [Vybrat]
enca *
test.srt: 7bit ASCII characters
  CRLF line terminators

Pokud je edituju (připíšu něco česky), tváří se jako "Doubly-encoded to UTF-8 from KOI-8_CS_2" případně "Unrecognized encoding".
Kód: [Vybrat]
enca *
test.srt:Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Doubly-encoded to UTF-8 from KOI-8_CS_2

Mimochodem nemám ubuntu ale debian wheezy a prostředí v cs_CZ.UTF-8, nevím co ještě relevantního bych měl uvést.

Nějaký nápad, kde je problém, v souboru nebo u mě? Nebo postup co se souborem udělat. Díky.
Debian

juwa2

  • Závislák
  • ****
  • Příspěvků: 2822
  • Karma: +203/-38
    • Zobrazit profil
Re:Převod titulků v ASCII na UTF-8
« Odpověď #1 kdy: 02 Únor 2017, 17:04:38 »
Tohle vyhovuje?

Tomtom

  • Návštěvník
  • *
  • Příspěvků: 84
  • Karma: +6/-0
    • Zobrazit profil
Re:Převod titulků v ASCII na UTF-8
« Odpověď #2 kdy: 02 Únor 2017, 17:31:01 »
Tohle vyhovuje?
Chtěl jsem se radovat, ale když soubor otevřu, připíšu třeba "č" (otvírám a ukládám jako utf8) zase je to zlé(tedy předpokládám, že to je zlé, tak nějak očekávám, že podobně pokažené kodování může dělat u přehrávání neplechu):

Kód: [Vybrat]
enca *
test_convert-počeštěný.srt: Universal transformation format 8 bits; UTF-8
Doubly-encoded to UTF-8 from KOI-8_CS_2
« Poslední změna: 02 Únor 2017, 17:37:15 od Tomtom »
Debian

Myrmica

  • Závislák
  • ****
  • Příspěvků: 1700
  • Karma: +161/-9
    • Zobrazit profil
    • MYRMICA
Re:Převod titulků v ASCII na UTF-8
« Odpověď #3 kdy: 02 Únor 2017, 17:58:45 »
Jen tak mimochodem, jak chceš převést titulky v prostém ASCII na UTF8? To přeci nejde, protože tabulka ASCII je obsažena v tabulce UTF8 a při převodu se nic nestane.
Musíš mít text napsaný v češtině aby enca byla schopna rozpoznat výchozí kódování. Pokud však je kódování souboru v UTF8 pak se defaultně převádí do kódování systému, tedy do UTF8 a zase se nic nestane... A aby byla enca schopna bezpečně určit výchozí znakovou sadu souboru potřebuje mít i dostatečné množství textu v daném kódování...
Stolní strojek: OS– UBUNTU 16.04 x86_64, MB ASUS P8 Z68-V/GEN3, Intel® Core™ i5-3470 CPU @ 3.20GHz × 4 , 16GiB DDR3, GeForce GTX 670...
Notebook: ASUS U53Jc OS– UBUNTU 16.04 x86_64, Windows 7, Processor – Intel Core i5-460M (2,53 GHz), Graphics – switchable NVIDIA GeForce 310M and Intel GMA HD

Tomtom

  • Návštěvník
  • *
  • Příspěvků: 84
  • Karma: +6/-0
    • Zobrazit profil
Re:Převod titulků v ASCII na UTF-8
« Odpověď #4 kdy: 02 Únor 2017, 18:14:03 »
...aby byla enca schopna bezpečně určit výchozí znakovou sadu souboru potřebuje mít i dostatečné množství textu v daném kódování...

V tom byl zakopaný pes. Zkoušel jsem to jen s pár písmeny, když vložím víc českého textu, už enca rozezná kodování správně.

Takže vyřešeno.
Děkuju všem!
« Poslední změna: 02 Únor 2017, 18:19:19 od Tomtom »
Debian