Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: Uran 26 Května 2010, 09:28:06
-
Potrebuju davkove prevadet vetsi mnozstvi doc (MSO) souboru do txt.
V soucasnosti pouzivam "Antiword". Problem je v tom, ze program se uz nevyviji a navic vystup je ve forme textu zarovnaneho do bloku s nerovnomernymi mezerami mezi slovy, coz pusobi pri cteni rusive.
Neznate nejakou alternativu za "Antoword" v CLI variante?
Neslo by neco podobneho delat pomoci openoffice? v "man openoffice" jsem na nic rozumneho nenarazil.
Dekuji uran
-
Zkus program wv ( sudo aptitude install wv ), umí toho hodně. Po nainstalování má různé příkazy jako wvCleanLatex wvDocBook wvText...
Tady je jeho domovská stránka, kde je vše popsáno: http://wvware.sourceforge.net (http://wvware.sourceforge.net).
-
Používam JODConverter. Treba naštartovať openoffice v service mode:
soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
Prevod pomocou JODConventer
java -jar jodconverter-cli-2.2.0.jar document.doc document.txt
Tento program používam viac ako 2 roky, zatiať bez problémov.
Pozri:
http://www.artofsolving.com/opensource/jodconverter (http://www.artofsolving.com/opensource/jodconverter)
http://www.artofsolving.com/opensource/jodconverter/guide (http://www.artofsolving.com/opensource/jodconverter/guide)
-
Dekuji urcite vyzkousim.
Zatim jsem nasela a pouzivam reseni antiword file.doc | sed -e 's/ \{2,\}/ /g'
, ktere my prozatim vyhovuje.