tolyangin: >> в Linux, то - извлечь картинки (возможно, утилитой pdfimages) и >> распознать их Cuneiform'ом.
To> Дмитрий если вам не сложно, объясните пожалуйсто как это сделать на To> практике. Покажите рабочие примеры команд и последовательность в To> которых их нужно выполнять. Программа pdfimages есть в пакете poppler-utils. pdfimages -j файл.pdf image В результате получится много файлов image-*. Чтобы их распознать, попробуйте сделать так: for x in image-* ; do nice cuneiform -l ruseng -o "$x".txt "$x" ; done To>>> Как поступать с форматами chm djvu тоже не ясно. >> djvu - распознавать. chm - распаковывать. В пакете libchm-bin есть >> утилита extract_chmLib, которая распаковывает chm: To> Что значит распозновать? Извините, но поиск информации о путях To> решения этих проблем у меня займет массу времени. Если вы To> сталкивались с подобными препятствиями и знаете код для их To> преодоления , напишите его в лист. Пишу, что помню. Чтобы писать подробнее, мне нужно разбираться самому. Вот что нашёл. Для начала djvu надо разобрать на отдельные страницы. Для этого djvu надо сконвертировать в многостраничный tiff или pdf. Например: ddjvu -format=tiff myfile.djvu myfile.tif Команда ddjvu есть в пакете djvulibre-bin. После этого tiff можно разобрать на страницы командой tiffsplit myfile.tif Получится много файлов x*.tif, которые можно распознавать cuneiform, как показано выше. Команда tiffsplit есть в пакете libtiff-tools. Или можно попробовать задать ddjvu формат pdf и извлечь картинки командой pdfimages. [...] To> Кстати а как в rbook можно делать закладки читая html страницы? У To> меня этот трюк никогда не получался. Попробуйте делать закладки с пакетом bookmark+. Скачать его можно отсюда: http://www.emacswiki.org/emacs/download/bookmark%2b.el Чтобы его скомпилировать, мне пришлось загрузить библиотеку warnings и скопировать файл в директорию из load-path. M-x load-library RET warnings RET После того, как Вы его скомпилируете и загрузите, w3m лучше закрыть (клавиша Q большое в раскладке info) и открыть заново (команда w3m). -- Дмитрий Падучих -- Blinux-rus mailing list [email protected] http://www.a11ywiki.org/cgi-bin/mailman/listinfo/blinux-rus
