On Sat, Jan 21, 2006 at 09:10:44PM +0300, Ed wrote: > >"позитивы" к файлам категорий. Только полная регенерация. Хотя он один из > >самых быстрых "баесов" был. Но надо _на сервере_ держать всю учебную базу. > > в случае imap - не проблема
Если у пользователей нет локальных архивов. > >>- нормальная работа с русским текстом (кодировки, всякие quoted-printable); > >> > >Кодировки не очень важны, ты просто часть базы теряешь на каждом тесте. mime, > >кажется, есть. > > ну а зачем терять? хотя прикрутить наверное не так уж и сложно Наверное, да. > >- как обрабатывать ложные срабатывания.Никак. Это же не спам. Ну попадет > >письмо в другую категорию. > > ну заодно хочется тогда уж и спам обрабатывать. хотя со спамом можно проще > поступить - делить на заведомый спам и подозрительные письма (которые уже > быстро просмаривать и переносить в спам/входящие). все равно проще, чем всю > почту разгребать. Спаморезалки _больше_ чем просто байес. Во-первых, потому, что текста, который и анализирует dbacl там, по большому счету, сейчас и нет. Картинки, служебные поля и т.д. dbacl просто выбрасывает. -- Иван Лох -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]