Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: konverze kodovani textovych souboru .pdb aby fungovala diakritika  (Přečteno 19664 krát)

karlitos

  • Stálý člen
  • **
  • Příspěvků: 1057
  • Bioinformatics - solutions in-silico
    • homepage
Zdravim

Uz se tady druhy den peru se zatim neresitelnym problemem. mam hromadu knizek ve formatu PDB -coz je format pro palmy, vicmene jde ale o textove dokumenty. Ctecka mi nezobrazuje spravne diakritiku, takze jsem hledal v jakem jsou ty soubory kodovani.
Kód: [Vybrat]
enca ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb
Kamenicky encoding; KEYBCS2

No a ted dveotazky :
  • jak overit ze je tenhle udaj spravny ?
  • jak udelat konverzi do nejakeho jineho formatovani ? (nejlepe unicode)

Zatim vsechno co jsem zkousel skoncilo nezdarem. Bud mi ebook-viewer integrovany v calibre ukaze akorat zmet znaku, v horsim pripade cast dokumentu chybi ... Co s tim ?

kdyby nekdo umel poradit budu moc moc rad - K
« Poslední změna: 10 Února 2011, 22:27:32 od karlitos »
Lenovo ThinkCentre A61 912073G
Athlon X2 5000+ 4GB RAM Nvidia Geforce 9500GT
Linux Mint 9 Isadora , Win7 64Bit

Filip Dominec

  • [Proplesk] [Piškot]
  • Stálý člen
  • **
  • Příspěvků: 1157
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #1 kdy: 09 Února 2011, 18:17:53 »
Karlitos, dej sem pár hlavních postupů, co jsi zkoušel. Jinak ti hrozí, že přijdou chytráci jako já a budou ti radit

cstocs -i kam utf8  ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb

a podobné triviality... :)
http://www.vrattenamstat.cz/ | Buďme tolerantní k triviálním dotazům; neznamenají "neumím to najít", ale "nejsem si jist, že to je správná cesta".

fish

  • Aktivní člen
  • *
  • Příspěvků: 307
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #2 kdy: 09 Února 2011, 19:57:17 »
.pdb je všeobecný formát súboru pre palm. Vo vnútri môžu byť rôzne dáta.
Knižky sú komprimované, treba ich rozbaliť. Na prezeranie .pdb používam script
Kód: [Vybrat]
txt2pdbdoc -d kniha.pdb | iconv -f cp1250 -t utf8 | less
txt2pdbdoc je v repository
Zatiaľ všetky .pdb knihy ktoré som mal boli v kódovaní cp1250

Na čítanie používam vo wine programy DocReader.exe (iba jeden .exe program) alebo ybook reder - ten treba inštalovať.
Ešte mám vyskúšaný editor pspad - vie čítať .pdb
Acer Aspire 5738ZG/Intel T4400/ATI MR HD 4650/4GB RAM :: Ubuntu 10.04 64bit/Kbuntu 10.10 64bit/Win7 HP 64bit

karlitos

  • Stálý člen
  • **
  • Příspěvků: 1057
  • Bioinformatics - solutions in-silico
    • homepage
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #3 kdy: 10 Února 2011, 13:12:25 »
Diky vsem za rady

Zkousel jsem udelat konverzi pomoci enca a iconv a jeste se dival ponejakych ceskych skriptecha programech, ale to je zhusta uz historie a stejne mi nepomohly.
Ja mam elektronickou ctecku knizek (s elektronickym inkoustem) kterou jsem chtel s tema knizkama pucit tatovi do nemocnice, jinak v linuxu pouzivam ebook-viewer ktery jse soucasti baliku calibre a mam odzkousene ze co mi zobrazi tenhle program dobe zobrazi i ta ctecka.
Kód: [Vybrat]
cstocs -i kam utf8  ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb mi vyrobi soubor ktery neotevre ani ten ebook-viewer ani txt2pdbdoc
Prekvapive to vypada ze kodovani je opravdu cp1250
Kód: [Vybrat]
txt2pdbdoc -d -v ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb  | iconv -f cp1250 -t utf8 | less

Forrest J. Ackerman

NĚMÁ OTÁZKA

(Mute Question)

Dvojhlavku trápil stále týž problém. "Mohu věřit," breptal rozštěpeným jazy­kem, "že by Člověk stvořil Mutanta k obrazu svému?"
Ten v příšeří ho neuznal za hodna odpově­di.
Od stěny se odpoutala druhá mutantova hlava. Odpověděla, jako by měla na jazyku vlas, měla totiž dva jazyky: "A co když nás Adam, syn člověka, stvořil Adamovou bom­bou?"
První hlava si odpovídala sama.
"Té povídačce s bombou vůbec nevěřím. A co ty Cizinče?"
Cizinec neodpovídal. Proč? To se nedalo jednoznačně říci, neboť v jeskyni byla tma. Dvojjazyk pokračoval:
"Kdyby Člověk stvořil Mutanty k obrazu svému, musel by být mnohotvárný. Jedna část by musela být dvojhlavá, aby se podoba­la nám, další by musela být jako Valikoule, další jako Osmiručka, kterého jsme potkali minulý týden, další jako Stonoh a ta posled­ní jako náš bratranec Strupoun. Pak by Člo­věk musel být zrůda: "Souhlasíš, Cizinče?"

Jenze ja jsem si horko-tezko udelal skript ktery mi tech cca. 2500 knizek zkonvertuje z .pdb do .epub
Kód: [Vybrat]
#!/bin/bash

sourcedir="$1"
destdir="$2"

echo "converting Directory: $sourcedir"

for subdir in "$sourcedir"/*
do
  if [[ -d "$subdir" ]]
  then
    for file in "$subdir"/*
    do
      mkdir -p "$destdir$subdir"
      cd "$destdir$subdir"
      ebook-convert "$file" ".epub" --input-encoding windows-1250 --single-line-paras
      cd "$subdir"
      #echo "File : $file"
      #echo "Directory : $destdir$subdir"
    done
  fi
done

No ale i kdyz pouziju --input-encoding windows-1250 tak mi ve vysledku chybely pismenka. Zkusim tedy jeste konverzi z cp1250 do UTF8.

EDIT :

Jeste doplnim :
Kód: [Vybrat]
$ iconv -f cp1250 -t utf8 ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb ~/Plocha/testing.pdb
Ackerman-Němá otázkEäĆEäĆTEXtREAd^@o n@o ForrestĘ.Áckerman

NĚMÁĎTÁZKA

(MuteŃuiconv: nepovolená vstupní sekvence na pozici 151

a kdyz pouziju :
Kód: [Vybrat]
cstocs -i cp1250 utf8 ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb vznikne opet soubor ktery se neda otevrit v zadne ctecce .pdb - ani softwarove ani hardwarove
« Poslední změna: 10 Února 2011, 13:19:17 od karlitos »
Lenovo ThinkCentre A61 912073G
Athlon X2 5000+ 4GB RAM Nvidia Geforce 9500GT
Linux Mint 9 Isadora , Win7 64Bit

pan Filuta

  • Aktivní člen
  • *
  • Příspěvků: 243
  • Tux, po třech milionech let v kosmu
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #4 kdy: 10 Února 2011, 19:43:55 »
Ahoj karlitosi. :)

Přišel jsem na jedno dočasné řešení.

pdb2txt.exe
+ převede velmi jednoduše všech 2 500 knih
+ utf8
+ v programu ebook-viewer je čeština v pořádku

- formát txt

Není možné nastavit, kam se nově vytvořené soubory uloží. Vedle "Hesse_Hermann_Stepni_vlk.pdb" vznikne "Hesse_Hermann_Stepni_vlk.pdb.txt". Takže si uděláš kopii celého adresáře a pak hromadně převedeš, odstraníš *.pdb a případně přejmenuješ.

Kód: [Vybrat]
wine pdb2txt.exe -utf8
EDIT: Po "dekompresi" kódování odpovídá.
Kód: [Vybrat]
$ txt2pdbdoc -d Hesse_Hermann_Stepni_vlk.pdb | enca
MS-Windows code page 1250
« Poslední změna: 10 Února 2011, 22:54:04 od Pan Filuta »

fish

  • Aktivní člen
  • *
  • Příspěvků: 307
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #5 kdy: 10 Února 2011, 21:42:59 »
.pdb súbor s knihou v aportis doc je niečo ako .zip súbor. Treba skonvertovať obsah a nie komprimované dáta ;)
Najlepší bude prevod do .pdb -> .txt cez txt2pdbdoc a iconv. Napríklad
Kód: [Vybrat]
txt2pdbdoc -d ~/Plocha/test/Ackerman_F_J-Němá\ otázka.pdb  | iconv -f cp1250 -t utf8 > ~/Plocha/test/Ackerman_F_J-Němá\ otázka.txt
typujem že pre konverziu do .epub je vhodné kódovani utf8.

potom prevod .txt -> epub

Prevod .pdb -> .txt požívam pravidelne (zxreader 2 na Nokii 5230 už neberie .pdb). Nemám problém.
.txt -> .epub neporadím, nepoužívam.
Acer Aspire 5738ZG/Intel T4400/ATI MR HD 4650/4GB RAM :: Ubuntu 10.04 64bit/Kbuntu 10.10 64bit/Win7 HP 64bit

karlitos

  • Stálý člen
  • **
  • Příspěvků: 1057
  • Bioinformatics - solutions in-silico
    • homepage
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #6 kdy: 10 Února 2011, 22:27:00 »
Diky vam vsem  :)
Calibre by melo zvladat konverzi z .txt do .epub, zkusim upravit ten muj script a nejdriv vsechny soubory zkonvertovat do .txt. Jenom by me zajimalo jestli tim nedojde k nejake ztrate informaci, treba nejakych metadat.
Kazdopadne ted uz je mi jasne proc nefunguje prima konverze .pdb do jineho kodovani.
Ozvu se jak jsem dopadl - aspon se provcicim v bashi.
Lenovo ThinkCentre A61 912073G
Athlon X2 5000+ 4GB RAM Nvidia Geforce 9500GT
Linux Mint 9 Isadora , Win7 64Bit

pan Filuta

  • Aktivní člen
  • *
  • Příspěvků: 243
  • Tux, po třech milionech let v kosmu
Re: konverze kodovani textovych souboru .pdb z Kamenicky encoding; KEYBCS2
« Odpověď #7 kdy: 10 Února 2011, 22:48:24 »
Jenom by me zajimalo jestli tim nedojde k nejake ztrate informaci, treba nejakych metadat.

Na pepak.net/download/formaty-pdb se píše: "Na českém e-bookovém webu se pod PDB obvykle myslí formát aplikace PalmDOC, což je víceméně prostý text bez jakýchkoliv příkras (formátování, metadata), jen jednoduše komprimovaný."

To platí i v tvém případě. V metadatech tvých knih je uveden pouze název. Ten se při převodu (s mezikrokem v .txt) ztratí.
« Poslední změna: 10 Února 2011, 23:04:22 od Pan Filuta »

karlitos

  • Stálý člen
  • **
  • Příspěvků: 1057
  • Bioinformatics - solutions in-silico
    • homepage
Re: konverze kodovani textovych souboru .pdb aby fungovala diakritika
« Odpověď #8 kdy: 11 Února 2011, 02:16:57 »
Sem uz moc utahanej takze detailni rozbor udelam az zitra, tady jsou chybove hlasky ktere mi to vyhazelo :
Kód: [Vybrat]
converting Directory: /media/Corsair Survivor/Eknihy/
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Adams, D/Adams, Douglas - Mlady Zafod Hraje Na Jistotu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Ale kdo nahradi cloveka.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Clovek sveho casu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Divka a robot s kvetinami.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Navsteva ameby.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Slintajici strom.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Stary sty.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Superhracky vam vydrzi cele leto.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Aldiss, B/Aldiss, Brian W - Ubohy bojovnicku.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Asimov, I/Asimov, Isaac - Dite Casu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Asimov, I/Asimov, Isaac - Galakticka rise 01 - Kosmicke proudy.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Asimov, I/Asimov, Isaac - Galakticka rise 03 - Oblazek Na Obloze.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Asimov, I/Asimov, Isaac - Nemesis.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Asimov, I/Asimov, Isaac - Sny robotu.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Bradbury, R/~$adbury_Ray-Míchačka na beton.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Bradbury, R/Bradbury_Ray-Prava, po domacku vyrobena egyptska mumie kapitana Stonesteela.pdb is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 168
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brin, D/Brin_David-Pokuseni.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 257
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brin, D/Brin_D-Pozvednutí-4-Utes nadeje.pdb is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 10145
iconv: nepovolená vstupní sekvence na pozici 33448
iconv: nepovolená vstupní sekvence na pozici 7104
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brown, D/Brown, Dan - Andele a demoni.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brown, D/Brown, Dan - Digitalni pevnost.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brown, D/Brown, Dan - Pavucina lzi.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Brown, D/Brown, Dan - Sifra mistra Leonarda.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Card, OS/Card_Orson_Scott-Corvi.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Clarke, AC/Clarke_Arthur_C-Rama 6 - Noc dvojiho uplnku.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Cook, G/Cook, Glen - CL1 Cerna legie.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Cook, G/Cook, Glen - CL2 Tyranuv stin.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Cook, G/Cook, Glen - CL3 Bila ruze.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Alien 5.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Hybris.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Kde duse ma koreny svymi se k zemi privine.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Nadupano.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Necekej, az smrt tve srdce rozzari.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Pohar vizi kralovny Iverin.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Tanec horizontalniho medveda.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Delf, A/Delf, Arco - Vodopad v Bilych srazech.pdb is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 258618
iconv: nepovolená vstupní sekvence na pozici 22360
iconv: nepovolená vstupní sekvence na pozici 286774
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Feist &Co/Feist Raymond E - Pohadka.pdb is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 508235
txt2pdbdoc: reading failed
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Garen, JP/J_P_GAREN-Mark_Stone_52_-_KAPITAN_PLUTON.PDB is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Gemmel, D/Gemmell David - Dcera Zelezne ruky.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Gemmel, D/Gemmell David - Drenajska saga 3 - Tulak 3 - Hrdina ve stinu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Gemmel, D/Gemmell David - Drenajska saga 6 - Legenda.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Harrison, H/Harrison_Harry-PL-Druha_planeta_smrti.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Harrison, H/Harrison_Harry-PL-Prvni_planeta_smrti.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Harrison, H/Harrison_Harry-PL-Treti_planeta_smrti.pdb is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 16496
iconv: nepovolená vstupní sekvence na pozici 15910
iconv: nepovolená vstupní sekvence na pozici 8267
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Heinlein, RA/Heinlein_Robert_A-Mesic_je_drsna_milenka.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 257
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Howard_Robert_E-Bran-Kralove Noci.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Howard Robert Ervin - Conan 01 - Vez slona.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Bohove Bal-Sagothu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Cerny Kamen.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Draci Seme.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Kralovstvi stinu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Mohyla Na Predhori.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Netvor Na Strese.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Pamatuj Na Smrt!.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Pisen Jednoho Naroda.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Pohori Umrlych.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Pomsta Cerneho Vulmey.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Pomsta Ze Zeme.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Svatyne Odpornosti.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Temna Socha.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Udoli cerva.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Vlci Hlava.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Howard, RE/Robert E. Howard - Zahrada Strachu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Cherryh, CJ/Cherryh_Carolyn_Janice-Nadoby.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Cherryh, CJ/Cherryh_Carolyn_Janice-Pal.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Klima, L/Klima Ladislav - Sus Triumfans.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 257
txt2pdbdoc: error: unknown file compression type: 257
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Lovecraft, HP/Lovecraft Howard Phillips - Ze Zapomneni.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
iconv: nepovolená vstupní sekvence na pozici 109223
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: error: unknown file compression type: 257
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Co delat nez prijde privolany psychoanalytik.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Dabel.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Dejte sanci mravencum.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Fermi a mraz.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Milionty den.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pohl, F/Pohl_Frederick-Navrat domu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pratchet, T/Pratchett Terry - Johnny 1 - Iba ty mozes zachranit ludstvo.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pratchet, T/Pratchett Terry - Johnny 2 - Johnny a mrtvi.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Pratchet, T/Pratchett Terry - Johnny 3 - Johnny a bomba.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Sapkowski, A/Sapkowski_Andrzej-Tandaradei.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Sapkowski, A/Sapkowski_Andrzej-UdalostvMischiefCreek.pdb is not a Doc file
txt2pdbdoc: error: unknown file compression type: 258
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Souček, L/Soucek_Ludvik-Bohove Atlantidy.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Souček, L/Soucek_Ludvik-Stvoritele.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Souček, L/Soucek_Ludvik-Tuseni 1 stinu.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Souček, L/Soucek_Ludvik-Tuseni 2 souvislosti.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Star Wars/Star Wars - Ruka Thrawnova 5 - Zahn T. - Pout pozustaleho.txt is not a Doc file
iconv: nepovolená vstupní sekvence na pozici 222
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Svandrlik, M/Svandrlik_Miloslav-Des_cisi_z_minulosti_aneb_Reinkarnace.pdb is not a Doc file
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: reading failed
txt2pdbdoc: error: unknown file compression type: 258
iconv: nepovolená vstupní sekvence na pozici 10853
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Wells, HG/Wells Herbert George - Valka svetu a jine pribehy z neskutecna 2 .pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Wilde, O/Wilde, Oscar - Obraz Doriana Graye.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Zamboch, M/Zamboch, Miroslav - Na ostrich cepeli.pdb is not a Doc file
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Zamboch, M/Zamboch, Miroslav - Temna trilogie.pdb is not a Doc file

A tady je muj vytvor :
(kamenovat prosim az po desate dopoledni a prosim o prihlednuti k dosavadni bezuhonnosti pachatele)
Kód: [Vybrat]
#!/bin/bash

sourcedir="$1"
destdir="$2"

echo "converting Directory: $sourcedir"

for subdir in "$sourcedir"/*
do
  if [[ -d "$subdir" ]]
  then
    for file in "$subdir"/*
    do
      #ebook-convert "$file" ".epub" --input-encoding windows-1250 --single-line-paras
      mkdir -p "$destdir$subdir"
      txt2pdbdoc -d "$file" | iconv -f cp1250 -t utf8 > "$destdir${file%.*}.txt"
      #echo "File : $file"
      #echo "Directory : $destdir$subdir"
    done
  fi
done
Lenovo ThinkCentre A61 912073G
Athlon X2 5000+ 4GB RAM Nvidia Geforce 9500GT
Linux Mint 9 Isadora , Win7 64Bit

pan Filuta

  • Aktivní člen
  • *
  • Příspěvků: 243
  • Tux, po třech milionech let v kosmu
Re: konverze kodovani textovych souboru .pdb aby fungovala diakritika
« Odpověď #9 kdy: 11 Února 2011, 09:32:13 »
Kód: [Vybrat]
txt2pdbdoc: /media/Corsair Survivor/Eknihy//Adams, D/Adams, Douglas - Mlady Zafod Hraje Na Jistotu.pdb is not a Doc file
...

Už jsem to psal v předchozím příspěvku. Soubor .pdb může být v mnoha různých formátech. Až si přečteš Formats for PalmOS, bude ti jasné, kde je problém.

karlitos

  • Stálý člen
  • **
  • Příspěvků: 1057
  • Bioinformatics - solutions in-silico
    • homepage
Re: konverze kodovani textovych souboru .pdb aby fungovala diakritika
« Odpověď #10 kdy: 09 Března 2011, 18:59:08 »
Zdravim

Ted jsem nemel cas, takze jsem ty knizky co se nezkonvertovaly dobre neresil, ale rad bych to dotahnul. Ten popis jsem si precetl, to je vsechno moc fajn, problem je ze mi no nerika co s tim. Muzu si rucne u cca. 100 souboru zjistit v jakem formatu jsou :
Citace
There is a way to determine what type of file a pdb file is though. If you open the file in a text editor, there will be a string of text that will identify the file type.
Jenze kdyz jsem treba hledal konvertor pro Plucker format tak jsem po pravde moc uspesny nebyl.

Zkousel jsem i konvertor PDB2TXT ze stranek pepak.net ale ten ty nestandartni formaty take zformatovat neumel a nakonec spadnul (byt pod  pod Windows 7)

Muzu jeste zkusti jestli to zvladne Calibre misto konverze do epub konverzi do txt, ale myslim ze v tom nebude valny rozdil protoze hlavni poblem nebyl ve formatech ale v tom ze to nezvladalo cestinu.
Lenovo ThinkCentre A61 912073G
Athlon X2 5000+ 4GB RAM Nvidia Geforce 9500GT
Linux Mint 9 Isadora , Win7 64Bit

 

Provoz zaštiťuje spolek OpenAlt.