Re: Mail archive indexing (for gnus/nnir or just standalone)

2003-07-10 Пенетрантность Dmitry Astapov

Evening, Victor. 

Victor B. Wagner [EMAIL PROTECTED] 15:20 8/7/2003 wrote:

 И в этом - основная загвоздка. Индексатор должен быть MIME-aware, либо к
 ней в кач. фильтра надо прикрутить какой-либо mail-to-plain-text converter
 (catmail anyone? :), которого я пока найти не смог ...

 VBW Тривиальный перловый скрипт с использованием MIME::Parser

Учитывая, что namazu написан на перле, я взял его и обточил напильником.
Скрипт получился не совсем тривиальный, но ... Мне для моих задач хватило.
Спасибо за наводку.

-- 
Dmitry Astapov //ADEpt
GPG KeyID/fprint: F5D7639D/CA36 E6C4 815D 434D 0498  2B08 7867 4860 F5D7 639D



Re: Mail archive indexing (for gnus/nnir or just standalone)

2003-07-08 Пенетрантность Dmitry Astapov

Evening, Victor. 

Victor B. Wagner [EMAIL PROTECTED] 19:56 4/7/2003 wrote:

 VBW 1. Всякие web-овские искалки, например mnogosearch (рекомендую
 VBW всячески) умеют индексировать не только html. Plain text (каковым является
 VBW содержимое Maildir) он тоже прекрасно отиндексирует. И даже можно
 VBW научить его это делать без использования http, хотя немного
 VBW нетривиально.
Увы, увы - содержимое Maildir не есть plaintext. Точнее, по форме - да, а
по сути - внутри может быть QP/base64 :( Я не хочу искать по '=C4=C2=F4' ...

И в этом - основная загвоздка. Индексатор должен быть MIME-aware, либо к
ней в кач. фильтра надо прикрутить какой-либо mail-to-plain-text converter
(catmail anyone? :), которого я пока найти не смог ...

[skip]

За остальные хинты - спасибо.

-- 
Dmitry Astapov //ADEpt
GPG KeyID/fprint: F5D7639D/CA36 E6C4 815D 434D 0498  2B08 7867 4860 F5D7 639D