Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Multimédia => Téma založeno: regine 22 Září 2014, 14:37:09
-
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGF?
Oba mají stejné hodnocení v repozitáři.
Potřebuji pro:
- běžné domácí užití,
- rezignuji na českou diakritiku (ale upřednostním ;)),
- většinou pro snímání z JPG, PNG, případně z PDF pokud vnitřně uloženo ne jako text,
- nepotřebuji udržet formátování,
- nepotřebuji konverzi do MS produktů, nemám je.
Hezký den přeji.
-
tak si je nainstaluj oba a ktery ti bude vyhovovat pouzivej. OMG.
-
OCRFeeder + Tesseract - první pokus - rychlý test.
Informativní popisek pro ostatní.
Samozřejmě problém s nastavením české diakritiky v Tesseract. Vyřešeny záludnosti s parametry.
Pokud sejmutí anglického textu, pak nutno nastavit v záložce Misc - "no language"
Vyzkoušeny 2 vstupní soubory (PNG a PDF - bezproblémové rozlišení pokud nejsou malé fonty) a 4 možnosti výstupu:
- ODT - nevím proč místo rozpoznaného "a" je ve výstup "á", místo malého "v" je "V" a jiné nezbednosti.
- HTML - jako ODT
- PDF - téměř perfektní "a" nebo "v", asi nejlépe vyřešeno UTF (kódová stránka).
- TXT - jako ODT
Tím, že nejlepší výstup je do needitovatelného PDF, tak velké zklamání. >:(
Až budu mít čas, tak zkusím YAGF s Cuneiform. Hlavně zdržuje nastavování rozlišení českého písma a jiné nedokumentované fičurky.
Doplněno dodatečně po vyzkoušení.
>>>>> Z obrázku PNG.
Terminál - CuneiForm:
Který SW pro rozlišení textu si instalovat z repozitáre OCRFeeder nebo YAGí?
Oba mají stejné hodnocení v repozitáii.
potieguji pro:
— běžné domácí užití,HODNOCENÍ:
+ rozezná řádkování
- horší detekce znaků
Terminál - Tesseract
Který SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'?
Oba mají stejné hodnocení v repozitáři.
Potřeguji pro:
- běžné domácí užití,HODNOCENÍ:
+ lepší detekce znaků než CuneiForm z příkazové řádku
+- řádkuje, ale přidává řádky
OCRFeeder + Tesseract:
Který SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'? Oba mají stejné hodnocení v repozitáři.
Potřeguji pro:
- běžné domácí užití,HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování
OCRFeeder + CuneiForm:
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGí? Oba mají stejné hodnocení v repozitáři. Potřegují pro: — běžné domácí užití,HODNOCENÍ:
? proč horší detekce znaků než z příkazového povelu v terminálu
- špatné řádkování
YAGF + Tesseract:
Který SW pro rnzlıšeni textu sı ınstalnvat Z repnzıtàře OCRFeedernebn YAGF Oba mají stejné hodnocení v repozitáři. Potřeguji pro: - hňìná dnmárí+ rozlišil slovo "YAGF"
? o něco lepší než YAGF s CuneiForm
YAGF + CuneiForm:
icterý SW pro rozbšeni textu si mstalovat z repozi táre OCRFeeder nebo YAGF Oba mají stejné hodnocení v repozitáii. potieguji pro: - hóan ó rlnmórl ořil I - žádné plus
_______________***____________
>>>>> Ze souboru PDF.
Terminál - CuneiForm - asi nelze
Terminál - Tesseract - určitě nelze, ověřeno
OCRFeeder + Tesseract:
Který SW pro rozlišení textu Si instalovat Z repozitáře OCRFeeder nebo YAGF? Oba mají Stejné hodnocení V repozitáři.
Potřeguji pro:
- běžné domácí užití,HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování
OCRFeeder + CuneiForm:
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGF? Oba mají stejné hodnocení v repozitáři. Potřeguji pro: — běžné domácí užití,- žádné plus
Závěr.
1. Pokud z obrázků detekce textu, potom přes terminál příkazem tesseract.
2. Pokud PDF (nejlépe Master PDF Editor ;)) nebo GUI ovládání, tak OCRFeeder + Tesseract.