No já jsem na win XP takový program měla - uměl to jakýsi program dodávaný ke skeneru CanoScan LiDE 200 ... už nevím, jak se jmenoval, ale stačilo v něm nastavit v možnostech skenování "ocr" a následně při ukládání "uložit jako pdf" ... výsledek bylo pdf v němž se dalo vyhledávat podtrhávat apod ....
Hrozně moc by se mi něco podobného hodilo i pro linux ( když mi xp odešly do křemíkového nebe) ... Přes ocr všechny ty texty "číst" by zabralo hrozně času (jedná se obvykle o publikace o několika stech stranách, které navíc obsahují i jiné typy písma - hebrejština, řečtina) ... obávám se, že najít nějaké OCR, které by tohle bez problému zvládlo, bude asi problém....
Já bych se toho ujal, ale čas budu mít až po vánocích, teď jsem na tom stejně jako pan Dominec, absolutně nezvládám
... kdybyste někdo něco podobného vytvořili, bylo by to úžasné

Klidně si za to i zaplatím, hlavně, aby to fungovalo