Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Obecná podpora => Téma založeno: rzekotka drzewna 22 Března 2012, 07:20:20

Název: OCR - dostupny free nebo i open source
Přispěvatel: rzekotka drzewna 22 Března 2012, 07:20:20
Ahoj, vite o nejakem OCR -volne dostupnem a nejlepe open source?
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: Luban 22 Března 2012, 07:47:31
Řešil jsem to i na win. Zkoušel jsem online konvertory na webu, ale výsledky nic moc. Potřeboval jsem převést naskenované seznamy čísel. Nakonec mi kolega poradil použít IrfanView (v 4.28) s pluginem KADMOS. Nevím, jak by to pracovalo pod wine a zda by to pro vaše potřeby stačilo.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: petus 22 Března 2012, 08:56:37
http://www.onlineocr.net/

nejlepší ocr, používám
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: Luban 22 Března 2012, 09:05:20
Znám, zkoušel jsem, bohužel na ty souřadnice byl lepší irfan. Ale jinak souhlasím, že je to v celku povedené.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: Krysař 22 Března 2012, 09:05:56
Nepouzivam to, takze nemohu posoudit funkcnost, ale kdyz dam do vyhledavani v synapticu OCR, tak to par vysledku vyhodi.
Napr. cuneiform, gocr, ocrad, ocropus, tesseract-ocr.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: jAster_BA 22 Března 2012, 14:29:59
Ono tie OCRka sú dosť oničom. Aj platený na Win som skúšal ale nedobre to rozpoznávalo.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: Kedrigern 22 Března 2012, 15:03:14
OCR jsem se chvíli živil. Jde o to tyto faktory:
1) Struktura textu
2) Font
3) Počet vad
4) Průměrnost textu

Pokud jsou všechny v míře přijatelné, tak AbiReader či OmniPage jsou fakt docela dobré. Ale běda jakmile libovolný z těch faktorů je těžký. Pak vám nepomůže nic.

Čili jde o to k čemu OCR potřebuješ. Já jsem pro jednu instituci digitalizoval knihy. Ale měli jsme tam pak i placené korektory. Pokud si chceš ulehčit práci s jednoduchým dokumentem, tak také ok. Pokud si myslíš, že převedeš různorodá data ve velkém do PC, tak bys mohl dost narazit.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: jAster_BA 22 Března 2012, 22:41:57
OCR jsem se chvíli živil. Jde o to tyto faktory:
1) Struktura textu
2) Font
3) Počet vad
4) Průměrnost textu

Pokud jsou všechny v míře přijatelné, tak AbiReader či OmniPage jsou fakt docela dobré. Ale běda jakmile libovolný z těch faktorů je těžký. Pak vám nepomůže nic.

Čili jde o to k čemu OCR potřebuješ. Já jsem pro jednu instituci digitalizoval knihy. Ale měli jsme tam pak i placené korektory. Pokud si chceš ulehčit práci s jednoduchým dokumentem, tak také ok. Pokud si myslíš, že převedeš různorodá data ve velkém do PC, tak bys mohl dost narazit.
Ide práve o tú korektúru. Už pri pár stránkach je to otravné.
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: rzekotka drzewna 01 Dubna 2012, 21:18:58
Zajimave, existuji tez selektivni OCR? napr naskenuje ze stranky pouze to co je podtrzene (a treba jen danou barvou) nebo treba texty mezi zacinajici a uzavirajici se skobou?
Název: Re:OCR - dostupny free nebo i open source
Přispěvatel: pet75 04 Října 2012, 19:50:21
Hraji si s tím už druhý večer. Zkoušel jsem OCRFeeder s moduly Tesserract, Ocrad, GOCR a Cuneiform. Nejlépe funguje GOCR, ale na ten online to nemá. (http://www.onlineocr.net)