Дмитрий Падучих wrote:

> tolyangin:
>
> To> Разобрал pdf , в результате получил череду файлов *.jpg
> To> Установил cuneiform , но на попытку распознать им текст,
> To> командой которую вы показали , ожидаемого результата не получаю
>
> To> $for x in image-* ; do nice cuneiform -l ruseng -o "$x".txt "$x"
> To> ; done Cuneiform for Linux 0.7.0 image-000.jpg is not a BMP
> To> file.
>
> jpeg'ов у меня под рукой нет, но tiff'ы распознаются нормально. Как
> ни странно, похоже, что Cuneiform в Ubuntu lucid собран без
> поддержки libmagick. Может, Вам попробовать установить пакет из
> Debian?
> http://packages.debian.org/sid/i386/cuneiform/download

>
Да, вы правы libmagick с ним не устанавливалась. Поставил libmagick и
версию сборки на которую вы дали линк, распознавание стало
возможным. Спасибо.

В случаях распознавания tif'ов результат довольно приемлем.  а вот jpg
распознает брутально, часто выдает "ошибка сегментирования".

У меня еще возникло два вопроса.
1.Можно ли улучшать  качество распознавания

2. Возможно есть утилиты при помощи которых можно результат
распознавания обрабатывать и приобразовывать   в формат удобный для чтения?

>
> PS. У Вас, кажется, сломалось цитирование. Нельзя ли это исправить?
>
> -- 
Да, извините. Забыл сразу установить emacs-goodies-el. Спасибо. 
-- 
Blinux-rus mailing list
[email protected]
http://www.a11ywiki.org/cgi-bin/mailman/listinfo/blinux-rus

Ответить