Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: Hakito 02 Června 2013, 15:52:53

Název: Skript - najdi v .txt souboru daný znak a nahraď ho [Vyřešeno]
Přispěvatel: Hakito 02 Června 2013, 15:52:53
Zdravím,
Má pouť za slovníkem T9 bez diakritiky v telefonu už se chýlí ke zdárnému konci. Mám seznam všech českých slov a potřebuju, aby byly znaky s diakritikou nahrazeny znaky bez diakritiky. Š→S a podobně.

Všechna slova jsou v .txt souboru a kdybych se ještě lépe neučil pracovat s javou, udělal bych to sám, ale pracovat se soubory netuším, jak..

Kdyby mi mohl někdo pomoct, byl bych nadmíru vděčen!

Jen pro informaci, celý seznam je 477kb čistého textu.
Název: Re:Skript - najdi v .txt souboru daný znak a nahraď ho
Přispěvatel: GdH 02 Června 2013, 16:09:11
Pokud to máš v utf-8 a bude ti stačit převod na ascii, takt zhruba takto:

Kód: [Vybrat]
iconv -f utf8 -t ASCII//TRANSLIT slova.txt > slova1.txt
Název: Re:Skript - najdi v .txt souboru daný znak a nahraď ho
Přispěvatel: Hakito 02 Června 2013, 16:12:20
Pokud to máš v utf-8 a bude ti stačit převod na ascii, takt zhruba takto:

Kód: [Vybrat]
iconv -f utf8 -t ASCII//TRANSLIT slova.txt > slova1.txt

Páni, funguje to, díky mockrát!
Název: Re:Skript - najdi v .txt souboru daný znak a nahraď ho [Vyřešeno]
Přispěvatel: beer 03 Června 2013, 12:29:40
Možná by příště bylo jednodušší stáhnout slovník bez diakritiky již hotový, například tento je pro firefox:

https://addons.mozilla.org/firefox/downloads/latest/413604/addon-413604-latest.xpi?src=dp-btn-primary

Nainstalovat a najít soubor persdict.dat, zkopírovat a přejmenovat na txt a máš slovník bez diakritiky.
Je to možná efektnější, nežli hledat slovník s diakritikou a pak ho konvertovat.
Název: Re:Skript - najdi v .txt souboru daný znak a nahraď ho [Vyřešeno]
Přispěvatel: Hakito 03 Června 2013, 12:32:41
Možná by příště bylo jednodušší stáhnout slovník bez diakritiky již hotový, například tento je pro firefox:

https://addons.mozilla.org/firefox/downloads/latest/413604/addon-413604-latest.xpi?src=dp-btn-primary

Nainstalovat a najít soubor persdict.dat, zkopírovat a přejmenovat na txt a máš slovník bez diakritiky.
Je to možná efektnější, nežli hledat slovník s diakritikou a pak ho konvertovat.

To jsem taky zkoušel, ale nepovedlo se mi zjistit jaký soubor to vlastně je a kde je umísten..