OCRFeeder +
Tesseract - první pokus - rychlý test.
Informativní popisek pro ostatní.
Samozřejmě problém s nastavením české diakritiky v
Tesseract. Vyřešeny záludnosti s parametry.
Pokud sejmutí anglického textu, pak nutno nastavit v záložce Misc - "no language"
Vyzkoušeny 2 vstupní soubory (PNG a PDF - bezproblémové rozlišení pokud nejsou malé fonty) a 4 možnosti výstupu:
- ODT - nevím proč místo rozpoznaného "a" je ve výstup "á", místo malého "v" je "V" a jiné nezbednosti.
- HTML - jako ODT
- PDF - téměř perfektní "a" nebo "v", asi nejlépe vyřešeno UTF (kódová stránka).
- TXT - jako ODT
Tím, že
nejlepší výstup je do needitovatelného PDF, tak velké zklamání.
Až budu mít čas, tak zkusím YAGF s Cuneiform. Hlavně zdržuje nastavování rozlišení českého písma a jiné nedokumentované fičurky.Doplněno dodatečně po vyzkoušení.>>>>>
Z obrázku PNG.Terminál - CuneiForm:Který SW pro rozlišení textu si instalovat z repozitáre OCRFeeder nebo YAGí?
Oba mají stejné hodnocení v repozitáii.
potieguji pro:
— běžné domácí užití,
HODNOCENÍ:
+ rozezná řádkování
- horší detekce znaků
Terminál - TesseractKterý SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'?
Oba mají stejné hodnocení v repozitáři.
Potřeguji pro:
- běžné domácí užití,
HODNOCENÍ:
+ lepší detekce znaků než CuneiForm z příkazové řádku
+- řádkuje, ale přidává řádky
OCRFeeder + Tesseract:Který SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'? Oba mají stejné hodnocení v repozitáři.
Potřeguji pro:
- běžné domácí užití,
HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování
OCRFeeder + CuneiForm:Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGí? Oba mají stejné hodnocení v repozitáři. Potřegují pro: — běžné domácí užití,
HODNOCENÍ:
? proč horší detekce znaků než z příkazového povelu v terminálu
- špatné řádkování
YAGF + Tesseract:Který SW pro rnzlıšeni textu sı ınstalnvat Z repnzıtàře OCRFeedernebn YAGF Oba mají stejné hodnocení v repozitáři. Potřeguji pro: - hňìná dnmárí
+ rozlišil slovo "YAGF"
? o něco lepší než YAGF s CuneiForm
YAGF + CuneiForm:icterý SW pro rozbšeni textu si mstalovat z repozi táre OCRFeeder nebo YAGF Oba mají stejné hodnocení v repozitáii. potieguji pro: - hóan ó rlnmórl ořil I
- žádné plus
_______________***____________
>>>>>
Ze souboru PDF.Terminál - CuneiForm - asi nelze
Terminál - Tesseract - určitě nelze, ověřeno
OCRFeeder + Tesseract:Který SW pro rozlišení textu Si instalovat Z repozitáře OCRFeeder nebo YAGF? Oba mají Stejné hodnocení V repozitáři.
Potřeguji pro:
- běžné domácí užití,
HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování
OCRFeeder + CuneiForm:Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGF? Oba mají stejné hodnocení v repozitáři. Potřeguji pro: — běžné domácí užití,
- žádné plus
Závěr.
1. Pokud z obrázků detekce textu, potom přes terminál příkazem tesseract.
2. Pokud PDF (nejlépe Master PDF Editor ) nebo GUI ovládání, tak OCRFeeder + Tesseract.