Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: Uran 26 Května 2010, 09:28:06

Název: konverze doc txt - cli
Přispěvatel: Uran 26 Května 2010, 09:28:06
Potrebuju davkove prevadet vetsi mnozstvi doc (MSO) souboru do txt.

V soucasnosti pouzivam "Antiword". Problem je v tom, ze program se uz nevyviji a navic vystup je ve forme textu zarovnaneho do bloku s nerovnomernymi mezerami mezi slovy, coz pusobi pri cteni rusive.

Neznate nejakou alternativu  za "Antoword" v CLI variante?

Neslo by neco podobneho delat pomoci openoffice? v "man openoffice" jsem na nic rozumneho nenarazil.


Dekuji uran
Název: Re: konverze doc txt - cli
Přispěvatel: Kedrigern 26 Května 2010, 10:39:30
Zkus program wv ( sudo aptitude install wv ), umí toho hodně. Po nainstalování má různé příkazy jako wvCleanLatex wvDocBook wvText...

Tady je jeho domovská stránka, kde je vše popsáno: http://wvware.sourceforge.net (http://wvware.sourceforge.net).
Název: Re: konverze doc txt - cli
Přispěvatel: fish 26 Května 2010, 10:48:25
Používam JODConverter. Treba naštartovať openoffice v service mode:
Kód: [Vybrat]
soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizardPrevod pomocou JODConventer
Kód: [Vybrat]
java -jar jodconverter-cli-2.2.0.jar document.doc document.txtTento program používam viac ako 2 roky, zatiať bez problémov.
Pozri:
http://www.artofsolving.com/opensource/jodconverter (http://www.artofsolving.com/opensource/jodconverter)
http://www.artofsolving.com/opensource/jodconverter/guide (http://www.artofsolving.com/opensource/jodconverter/guide)

Název: Re: konverze doc txt - cli
Přispěvatel: Uran 26 Května 2010, 10:51:30
Dekuji urcite vyzkousim.

Zatim jsem nasela a pouzivam reseni
Kód: [Vybrat]
antiword file.doc | sed -e 's/ \{2,\}/ /g', ktere my prozatim vyhovuje.