[Homeros] CuneiForm и pdf (was: о задачах)

Nikita nikita-mailings на rambler.ru
Пн Дек 29 19:53:35 MSK 2014


Здравствуйте, Michael Pozhidaev.

> Насколько могу судить, проблемки в этом месте действительно есть. На
> помощь может теоретически придти  рецепт предварительной растеризации
pdf'ки с использованием ghostscript.

Есть вроде собранный пакет под Ubuntu Pdf OCR PPA
https://launchpad.net/~gezakovacs/+archive/ubuntu/pdfocr
Ну и есть в принципе и другие варианты, см.
http://habrahabr.ru/post/153617/
Хотя несколько лет назад я тоже PDF и DjVu дробил на jpg, а уже потом 
распознавал, но сейчас если и приходится, то, уж простите, делаю это в 
FineReader на Windows или OS X, так что мой опыт не очень репрезентативен.
Успехов. Никита. 



Подробная информация о списке рассылки Homeros