Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Multimédia => Téma založeno: regine 22 Září 2014, 14:37:09

Název: OCR rozlišení - které - OCRFeeder nebo YAGF [vyřešeno]
Přispěvatel: regine 22 Září 2014, 14:37:09
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGF?
Oba mají stejné hodnocení v repozitáři.
Potřebuji pro:
- běžné domácí užití,
- rezignuji na českou diakritiku (ale upřednostním  ;)),
- většinou pro snímání z JPG, PNG, případně z PDF pokud vnitřně uloženo ne jako text,
- nepotřebuji udržet formátování,
- nepotřebuji konverzi do MS produktů, nemám je.

Hezký den přeji.
Název: Re:OCR rozlišení - které - OCRFeeder nebo YAGF
Přispěvatel: Martin Šácha 22 Září 2014, 15:03:39
tak si je nainstaluj oba a ktery ti bude vyhovovat pouzivej. OMG.
Název: OCRFeeder + Tesseract
Přispěvatel: regine 22 Září 2014, 19:15:15
OCRFeeder + Tesseract - první pokus - rychlý test.
Informativní popisek pro ostatní.
Samozřejmě problém s nastavením české diakritiky v Tesseract. Vyřešeny záludnosti s parametry.
Pokud sejmutí anglického textu, pak nutno nastavit v záložce Misc - "no language"
Vyzkoušeny 2 vstupní soubory (PNG a PDF - bezproblémové rozlišení pokud nejsou malé fonty) a 4 možnosti výstupu:
- ODT - nevím proč místo rozpoznaného "a" je ve výstup "á", místo malého "v" je "V" a jiné nezbednosti.
- HTML - jako ODT
- PDF - téměř perfektní "a" nebo "v", asi nejlépe vyřešeno UTF (kódová stránka).
- TXT - jako ODT
Tím, že nejlepší výstup je do needitovatelného PDF, tak velké zklamání. >:(

Až budu mít čas, tak zkusím YAGF s Cuneiform. Hlavně zdržuje nastavování rozlišení českého písma a jiné nedokumentované fičurky.

Doplněno dodatečně po vyzkoušení.
>>>>> Z obrázku PNG.

Terminál - CuneiForm:
Kód: [Vybrat]
Který SW pro rozlišení textu si instalovat z repozitáre OCRFeeder nebo YAGí?
Oba mají stejné hodnocení v repozitáii.
potieguji pro:
— běžné domácí užití,
HODNOCENÍ:
+ rozezná řádkování
- horší detekce znaků

Terminál - Tesseract
Kód: [Vybrat]
Který SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'?
Oba mají stejné hodnocení v repozitáři.

Potřeguji pro:

- běžné domácí užití,
HODNOCENÍ:
+ lepší detekce znaků než CuneiForm z příkazové řádku
+- řádkuje, ale přidává řádky

OCRFeeder + Tesseract:
Kód: [Vybrat]
Který SW pro rozlišení textu si instalovat Z repozitáře OCRFeedernebo YAGI'? Oba mají stejné hodnocení v repozitáři.
Potřeguji pro:
- běžné domácí užití,
HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování

OCRFeeder + CuneiForm:
Kód: [Vybrat]
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGí?  Oba mají stejné hodnocení v repozitáři.  Potřegují pro:  — běžné domácí užití,HODNOCENÍ:
? proč horší detekce znaků než z příkazového povelu v terminálu
- špatné řádkování

YAGF + Tesseract:
Kód: [Vybrat]
Který SW pro rnzlıšeni textu sı ınstalnvat Z repnzıtàře OCRFeedernebn YAGF Oba mají stejné hodnocení v repozitáři. Potřeguji pro: - hňìná dnmárí+ rozlišil slovo "YAGF"
? o něco lepší než YAGF s CuneiForm

YAGF + CuneiForm:
Kód: [Vybrat]
icterý SW pro rozbšeni textu si mstalovat z repozi táre OCRFeeder nebo YAGF Oba mají stejné hodnocení v repozitáii. potieguji pro: - hóan ó rlnmórl ořil I - žádné plus

_______________***____________
>>>>> Ze souboru PDF.

Terminál - CuneiForm - asi nelze
Terminál - Tesseract - určitě nelze, ověřeno

OCRFeeder + Tesseract:
Kód: [Vybrat]
Který SW pro rozlišení textu Si instalovat Z repozitáře OCRFeeder nebo YAGF? Oba mají Stejné hodnocení V repozitáři.
Potřeguji pro:
- běžné domácí užití,
HODNOCENÍ:
+ nejlepší detekce znaků
- špatné řádkování

OCRFeeder + CuneiForm:
Kód: [Vybrat]
Který SW pro rozlišení textu si instalovat z repozitáře OCRFeeder nebo YAGF?  Oba mají stejné hodnocení v repozitáři.  Potřeguji pro:  — běžné domácí užití,- žádné plus

Závěr.
1. Pokud z obrázků detekce textu, potom přes terminál příkazem tesseract.
2. Pokud PDF (nejlépe Master PDF Editor  ;)) nebo GUI ovládání, tak OCRFeeder + Tesseract.