[Homeros] CuneiForm и pdf (was: о задачах)
Nikita
nikita-mailings на rambler.ru
Пн Дек 29 19:53:35 MSK 2014
Здравствуйте, Michael Pozhidaev.
> Насколько могу судить, проблемки в этом месте действительно есть. На
> помощь может теоретически придти рецепт предварительной растеризации
pdf'ки с использованием ghostscript.
Есть вроде собранный пакет под Ubuntu Pdf OCR PPA
https://launchpad.net/~gezakovacs/+archive/ubuntu/pdfocr
Ну и есть в принципе и другие варианты, см.
http://habrahabr.ru/post/153617/
Хотя несколько лет назад я тоже PDF и DjVu дробил на jpg, а уже потом
распознавал, но сейчас если и приходится, то, уж простите, делаю это в
FineReader на Windows или OS X, так что мой опыт не очень репрезентативен.
Успехов. Никита.
Подробная информация о списке рассылки Homeros