Re: OCR в Debian
On 5/24/17, Victor Wagner wrote: > Что у нас еще есть? tesseract (приятно удивила толпа языковых пакетов, > может и правда живет?) ocrad, gocr? Последний выглядит как давно не > развивающийся. Давным-давно, в году 10 или 11 tesseract неплохо распознавал отсканированную книгу без таблиц и картинок. Качество было неплохим.
Re: OCR в Debian
On Wed, 24 May 2017 10:45:49 +0300 Victor Wagner wrote: VW> cuneiform, насколько я понимаю, с момента открытия исходников не VW> развивается совсем. Он не развивался много лет *до* открытия исходников. После, насколько помню, что-то там делали. Как сейчас - не в курсе. Пользовался им немного. Результат бывает разный, в зависимости от того, что распознаётся. В среднем, не очень. Лучше уж фпайнридер под виндой в виртуалке, если важен результат.
OCR в Debian
Коллеги, а что у нас с OCR? Есть ли в составе дистрибутива (лучше stable или backports, но ради такого и на тестинг сапгрейдиться не поленюсь) что-нибудь, посредством чего можно превратить в удобочитаемую электронную книгу на русском языке пачку графических файлов из-под scantailor? А если оно с таблицами? cuneiform, насколько я понимаю, с момента открытия исходников не развивается совсем. И глючен безмерно и в кору падает по каждому чиху. Что у нас еще есть? tesseract (приятно удивила толпа языковых пакетов, может и правда живет?) ocrad, gocr? Последний выглядит как давно не развивающийся. --