Фильтры документов для системы полнотекстового поиска

2009-11-01 Thread Alexey Pechnikov
Hello! В фильтрах от tracker ssindex из gnumeric преобразует в текст файлы csv с разными разделителями и таблицы от msoffice, abiword, gnumeric,... Ман нашел вот здесь http://linux.die.net/man/1/ssindex Хотелось бы что-то без такого количества зависимостей. И еще по теме - есть такая утилитка w

Re: Фильтры документов для системы полнотекстового поиска

2009-11-01 Thread Alexey Pechnikov
Hello! On Sunday 01 November 2009 19:13:50 Artem Chuprina wrote: > Нет, судя по тому, что в этой утилитке написано, "обмануть" ее можно > тупо и цинично - указав /dev/stdout в качестве выходного файла. Но от > промежуточных файлов это тебя никак не избавит. > > А вообще - RTFS было бы сделать бы

Re: Фильтры документов для системы полнотекстового поиска

2009-11-02 Thread Иван Лох
On Sun, Nov 01, 2009 at 06:28:51PM +0300, Alexey Pechnikov wrote: > Hello! > > В фильтрах от tracker ssindex из gnumeric преобразует в текст > файлы csv с разными разделителями и таблицы от msoffice, > abiword, gnumeric,... > Ман нашел вот здесь > http://linux.die.net/man/1/ssindex > > Хотелось

Re: Фильтры документов для системы полнотекстового поиска

2009-11-05 Thread Michael Shigorin
On Sun, Nov 01, 2009 at 06:28:51PM +0300, Alexey Pechnikov wrote: > Хотелось бы что-то без такого количества зависимостей. Посмотрите конверторы от recoll (а возможно, и вся софтина подойдёт, либо захочется станцевать от xapian-core -- движок очень достойный, локально даёт фору гуглю при работе по

Re: Фильтры документов для системы полнотекстового поиска

2009-12-08 Thread Michael Shigorin
On Fri, Nov 06, 2009 at 05:21:53PM +0300, Alexey Pechnikov wrote: > > > Хотелось бы что-то без такого количества зависимостей. > > Посмотрите конверторы от recoll (а возможно, и вся софтина > > подойдёт, > Не знал такого, посмотрел. Реализовано не совсем криво, хотя выбран явно > не лучший вариант

Re: Фильтры документов для системы полнотекстового поиска

2009-12-08 Thread Alexey Pechnikov
Hello! On Tuesday 08 December 2009 17:38:49 Michael Shigorin wrote: > > Что интересно, обещана интересная фича - переключение стеммера на > > уровне поискового запроса. Получается, стеммер только для запроса > > используют, а при индексировании - нет? > > Простите за "оперативный" ответ -- Вас

Re: Фильтры документов для системы полнотекстового поиска - формат odt

2009-11-02 Thread Alexey Pechnikov
Hello! On Monday 02 November 2009 18:18:13 Иван Лох wrote: > Это ладно. Меня больше всего ужасает использование evolution > для индексирования почты. Которое у меня еще и не работает. > > Кроме того, может кто-нибудь уже докопался до того, как можно > переиндексировать все файлы определенного MIM

Re: Фильтры документов для системы полнотекстового поиска - формат odt

2009-11-02 Thread Serhiy Storchaka
Alexey Pechnikov wrote: > cat <(echo "")\ > <(echo " xmlns:office='urn:oasis:names:tc:opendocument:xmlns:office:1.0'>")\ > <(unzip -p 101.odt meta.xml |grep -v " 101.odt content.xml |grep -v " styles.xml |grep -v " "")\ > |xsltproc odt2html.xsl - > > Оно работает, и без временных файлов. Но

Re: Фильтры документов для системы полнотекстового поиска - формат odt

2009-11-03 Thread Alexey Pechnikov
Hello! On Tuesday 03 November 2009 10:45:03 Serhiy Storchaka wrote: > "Не дудите котов". > > (echo ... > echo ... > unzip ... > unzip ... > unzip ... > echo ...) | xsltproc odt2html.xsl - Спасибо, котам полегчало :-) Best regards, Alexey Pechnikov. http://pechnikov.tel/