Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: Hakito 02 Června 2013, 15:52:53
-
Zdravím,
Má pouť za slovníkem T9 bez diakritiky v telefonu už se chýlí ke zdárnému konci. Mám seznam všech českých slov a potřebuju, aby byly znaky s diakritikou nahrazeny znaky bez diakritiky. Š→S a podobně.
Všechna slova jsou v .txt souboru a kdybych se ještě lépe neučil pracovat s javou, udělal bych to sám, ale pracovat se soubory netuším, jak..
Kdyby mi mohl někdo pomoct, byl bych nadmíru vděčen!
Jen pro informaci, celý seznam je 477kb čistého textu.
-
Pokud to máš v utf-8 a bude ti stačit převod na ascii, takt zhruba takto:
iconv -f utf8 -t ASCII//TRANSLIT slova.txt > slova1.txt
-
Pokud to máš v utf-8 a bude ti stačit převod na ascii, takt zhruba takto:
iconv -f utf8 -t ASCII//TRANSLIT slova.txt > slova1.txt
Páni, funguje to, díky mockrát!
-
Možná by příště bylo jednodušší stáhnout slovník bez diakritiky již hotový, například tento je pro firefox:
https://addons.mozilla.org/firefox/downloads/latest/413604/addon-413604-latest.xpi?src=dp-btn-primary
Nainstalovat a najít soubor persdict.dat, zkopírovat a přejmenovat na txt a máš slovník bez diakritiky.
Je to možná efektnější, nežli hledat slovník s diakritikou a pak ho konvertovat.
-
Možná by příště bylo jednodušší stáhnout slovník bez diakritiky již hotový, například tento je pro firefox:
https://addons.mozilla.org/firefox/downloads/latest/413604/addon-413604-latest.xpi?src=dp-btn-primary
Nainstalovat a najít soubor persdict.dat, zkopírovat a přejmenovat na txt a máš slovník bez diakritiky.
Je to možná efektnější, nežli hledat slovník s diakritikou a pak ho konvertovat.
To jsem taky zkoušel, ale nepovedlo se mi zjistit jaký soubor to vlastně je a kde je umísten..