Источник - http://www.linux.org.ru/news/opensource/5404088
Tesseract 3.00 -- новая версия ПО для оптического распознавания текста
Программисты компании Google выпустили третью версию Tesseract, системы
оптического распознавания текста.
В новой версии добавлена поддержка множества языков, включая русский.
В числе прочих изменений:
* добавлен новый модуль анализа структуры документа;
* добавлена поддержка формата HOCR;
* библиотека Leptonica стала основной для работы с изображениями;
* переписан код для работы с неоднозначно распознанными символами;
* удалена поддержка VC++6.
Загрузить можно [20]здесь.
>>> [21]Подробности
Метки: [22]google, [23]ocr, [24]tesseract
References
20. http://code.google.com/p/tesseract-ocr/downloads/list
21. http://groups.google.com/group/tesseract-ocr/msg/f240b6c7c5afa08b
22. http://www.linux.org.ru/view-news.jsp?tag=google
23. http://www.linux.org.ru/view-news.jsp?tag=ocr
24. http://www.linux.org.ru/view-news.jsp?tag=tesseract
--
Дмитрий Падучих
--
Blinux-rus mailing list
[email protected]
http://www.a11ywiki.org/cgi-bin/mailman/listinfo/blinux-rus