Дмитрий Падучих wrote: > tolyangin: > > To> Разобрал pdf , в результате получил череду файлов *.jpg > To> Установил cuneiform , но на попытку распознать им текст, > To> командой которую вы показали , ожидаемого результата не получаю > > To> $for x in image-* ; do nice cuneiform -l ruseng -o "$x".txt "$x" > To> ; done Cuneiform for Linux 0.7.0 image-000.jpg is not a BMP > To> file. > > jpeg'ов у меня под рукой нет, но tiff'ы распознаются нормально. Как > ни странно, похоже, что Cuneiform в Ubuntu lucid собран без > поддержки libmagick. Может, Вам попробовать установить пакет из > Debian? > http://packages.debian.org/sid/i386/cuneiform/download
> Да, вы правы libmagick с ним не устанавливалась. Поставил libmagick и версию сборки на которую вы дали линк, распознавание стало возможным. Спасибо. В случаях распознавания tif'ов результат довольно приемлем. а вот jpg распознает брутально, часто выдает "ошибка сегментирования". У меня еще возникло два вопроса. 1.Можно ли улучшать качество распознавания 2. Возможно есть утилиты при помощи которых можно результат распознавания обрабатывать и приобразовывать в формат удобный для чтения? > > PS. У Вас, кажется, сломалось цитирование. Нельзя ли это исправить? > > -- Да, извините. Забыл сразу установить emacs-goodies-el. Спасибо. -- Blinux-rus mailing list [email protected] http://www.a11ywiki.org/cgi-bin/mailman/listinfo/blinux-rus
