Re: OCR в Debian

2017-05-24 Пенетрантность Hleb Valoshka
On 5/24/17, Victor Wagner  wrote:

> Что у нас еще есть? tesseract (приятно удивила толпа языковых пакетов,
> может и правда живет?) ocrad, gocr? Последний выглядит как давно не
> развивающийся.

Давным-давно, в году 10 или 11 tesseract неплохо распознавал
отсканированную книгу без таблиц и картинок. Качество было неплохим.


Re: OCR в Debian

2017-05-24 Пенетрантность a . v . korotkov
On Wed, 24 May 2017 10:45:49 +0300
Victor Wagner wrote:

VW> cuneiform, насколько я понимаю, с момента открытия исходников не
VW> развивается совсем.

Он не развивался много лет *до* открытия исходников. После, насколько
помню, что-то там делали. Как сейчас - не в курсе.

Пользовался им немного. Результат бывает разный, в зависимости от того,
что распознаётся. В среднем, не очень.

Лучше уж фпайнридер под виндой в виртуалке, если важен результат.



OCR в Debian

2017-05-24 Пенетрантность Victor Wagner

Коллеги, а что у нас с OCR?

Есть ли в составе дистрибутива (лучше stable или backports, но ради
такого и на тестинг сапгрейдиться не поленюсь) что-нибудь, посредством
чего можно превратить в удобочитаемую электронную книгу на русском
языке пачку графических файлов из-под scantailor? А если оно с
таблицами?

cuneiform, насколько я понимаю, с момента открытия исходников не
развивается совсем. И глючен безмерно и в кору падает по каждому чиху.

Что у нас еще есть? tesseract (приятно удивила толпа языковых пакетов,
может и правда живет?) ocrad, gocr? Последний выглядит как давно не
развивающийся.

--