On 2002.11.25 at 15:19:41 +0400, Vlad Harchev wrote: > > Перегнать все pdf в текст и искать в тексте grep'ом. > Правда с русским языком могут быть проблемы (с его кодировкой). > > Для этого можно пользовать pdftotext из пакета xpdf и pdf2ps и затем > ps2ascii из ghostscript.
А ps2ascii уже научился работать не с ascii, а с 8-битными символами? Или кто-то уже написал хреновину, которая подбирает в постскрипте вектор кодировки и пишет в выходной файл glyph names (перегнать потом эти glyph names в unicode или другую полезную кодировку - не проблема) -- Victor Wagner [EMAIL PROTECTED] Chief Technical Officer Office:7-(095)-748-53-88 Communiware.Net Home: 7-(095)-135-46-61 http://www.communiware.net http://www.ice.ru/~vitus