Re: SpamAssassin+russian spam
On Thu, 25 Sep 2003 19:10:28 +0400 Alexander GQ Gerasiov (Alexander) wrote: SO Мне пришлось понервничать немного, из-за того что он вроде обучался, SO но свои оценки не выставлял на вот этот вирусный бум. Как оказалось в SO факе - у него есть минимальный порог на 200 сообщений. Alexander Да, для включения анализа необходимо 200 спам и 200 неспам Alexander писем. Я просто вручную sa-learn'ом его обучил и все. Да, но я об этом узнал из FAQ у них на сайте. SO И ещё один момент - SA выставляет оценку по The BAT! вроде не верно, SO во всяком случае было письмо, которое точно отправлялось батом, а SA SO ставил оценку :( Alexander Проверь на моем письме :) У меня вроде все нормально с батом. Ну ко мне письмо пришло через murphy.debian.org, а не оригинальное, но по-идее, Message-ID должен был остаться оригинальный: Message-ID: [EMAIL PROTECTED] так что SA должен проверить, вот что получилось: X-Spam-Status: No, hits=-4.8 required=5.0 tests=BAYES_10,IN_REP_TO,REFERENCES,X_LOOP,X_MAILING_LIST version=2.55 X-Spam-Level: Ну да ладно, будем считать эту тему закрытой, всем спасибо! -- Serge Olkhowik [EMAIL PROTECTED] ISD Configuration Management Team [EMAIL PROTECTED]
Re: SpamAssassin+russian spam
On Wed, 17 Sep 2003 15:17:43 +0400 Alexander GQ Gerasiov (Alexander) wrote: SO Но есть у меня одно отличие - у меня вся почта в maildir для SO courier-imap. У sa-learn есть опция --dir, тогда можно его SO натравливать на что-то типа ~/Maildir/.spam/cur. Но у меня остаётся SO вопрос - нигде в доках не нашёл - можно ли удалять эти письма после SO запуска sa-learn, ведёт ли он свою базу знаний? Alexander Да, конечно. Два условия: 1е когда говоришь sa-learn то SA Alexander должен знать, где хранятся файлы для bayes-анализа 2.sa-learn Alexander должен быть запущен от имени того пользователя от которого Alexander обычно работает spamd (если настроена глабальная проверка Alexander почты) или должна быть соответствующая директива в конфиге о Alexander том, какие права выставлять на файлы базы. Класс, работает! Спасибо! Мне пришлось понервничать немного, из-за того что он вроде обучался, но свои оценки не выставлял на вот этот вирусный бум. Как оказалось в факе - у него есть минимальный порог на 200 сообщений. После этого пришлось покрутить BAYES_ оценки и поставить их повыше для 70..99%. Сейчас всё отлично! И ещё один момент - SA выставляет оценку по The BAT! вроде не верно, во всяком случае было письмо, которое точно отправлялось батом, а SA ставил оценку :( -- Serge Olkhowik [EMAIL PROTECTED] ISD Configuration Management Team [EMAIL PROTECTED]
Re[2]: SpamAssassin+russian spam
Привет Serge, 25 сентября 2003 г. было написано: SO Класс, работает! Спасибо! SO Мне пришлось понервничать немного, из-за того что он вроде обучался, но SO свои оценки не выставлял на вот этот вирусный бум. Как оказалось в факе - SO у него есть минимальный порог на 200 сообщений. Да, для включения анализа необходимо 200 спам и 200 неспам писем. Я просто вручную sa-learn'ом его обучил и все. SO После этого пришлось покрутить BAYES_ оценки и поставить их повыше для SO 70..99%. Сейчас всё отлично! SO И ещё один момент - SA выставляет оценку по The BAT! вроде не верно, во SO всяком случае было письмо, которое точно отправлялось батом, а SA ставил SO оценку :( Проверь на моем письме :) У меня вроде все нормально с батом. Best regards, Alexander GQ Gerasiov [EMAIL PROTECTED] Кука: Поставьте себе немного ОС! Половину! Вам хватит!
Re[2]: SpamAssassin+russian spam
Привет Serge, 17 сентября 2003 г. было написано: SO Но есть у меня одно отличие - у меня вся почта в maildir для SO courier-imap. У sa-learn есть опция --dir, тогда можно его натравливать на SO что-то типа ~/Maildir/.spam/cur. Но у меня остаётся вопрос - нигде в доках SO не нашёл - можно ли удалять эти письма после запуска sa-learn, ведёт ли он SO свою базу знаний? Да, конечно. Два условия: 1е когда говоришь sa-learn то SA должен знать, где хранятся файлы для bayes-анализа 2.sa-learn должен быть запущен от имени того пользователя от которого обычно работает spamd (если настроена глабальная проверка почты) или должна быть соответствующая директива в конфиге о том, какие права выставлять на файлы базы. Best regards, Alexander GQ Gerasiov [EMAIL PROTECTED] Кука: Человек - это пpомежуточное звено эволюции, необходимое для создания венца твоpения пpиpоды - pюмки коньяка и дольки лимона. np: [Chillout Moods] Compact Disc 3 -- Sacred Spirit - Roots
Re: SpamAssassin+russian spam
On Wed, 17 Sep 2003 11:42:18 +0300 Serge Olkhowik wrote: У меня есть свой домашний домен, который бы хотелось обрабатывать SA. При этом весь обнаруженный спам на этот домен заворачивать лично мне, а я его procmail-ом по аналогии с Николаем либо прибивать, либо в probably. В принципе нашёл доки с примерами для Exim 3, получилось то, что я хочу. Но есть у меня одно отличие - у меня вся почта в maildir для courier-imap. У sa-learn есть опция --dir, тогда можно его натравливать на что-то типа ~/Maildir/.spam/cur. Но у меня остаётся вопрос - нигде в доках не нашёл - можно ли удалять эти письма после запуска sa-learn, ведёт ли он свою базу знаний? Так, вроде разобрался. Всем спасибо ;) -- Serge Olkhowik [EMAIL PROTECTED] ISD Configuration Management Team [EMAIL PROTECTED]
Re: SpamAssassin+russian spam
Но есть у меня одно отличие - у меня вся почта в maildir для courier-imap. У sa-learn есть опция --dir, тогда можно его натравливать на что-то типа ~/Maildir/.spam/cur. Но у меня остаётся вопрос - нигде в доках не нашёл - можно ли удалять эти письма после запуска sa-learn, ведёт ли он свою базу знаний? Так, вроде разобрался. Всем спасибо ;) Ну вот, я тоже хотел бы услышать, как оно на самом деле... Расскажи, что нарыл :)
Re: SpamAssassin+russian spam
* Dmitriy Sirant [EMAIL PROTECTED] [030918 13:43]: Но есть у меня одно отличие - у меня вся почта в maildir для courier-imap. У sa-learn есть опция --dir, тогда можно его натравливать на что-то типа ~/Maildir/.spam/cur. Но у меня остаётся вопрос - нигде в доках не нашёл - можно ли удалять эти письма после запуска sa-learn, ведёт ли он свою базу знаний? Так, вроде разобрался. Всем спасибо ;) Ну вот, я тоже хотел бы услышать, как оно на самом деле... Расскажи, что нарыл :) Результат обучения sa находится тут: [EMAIL PROTECTED]:$ ls -l .spamassassin/bayes_* -rw---1 mn users 963684 Сен 18 14:25 .spamassassin/bayes_journal -rw---1 mn users4415 Сен 18 14:25 .spamassassin/bayes_msgcount -rw---1 mn users 1712173 Сен 18 14:25 .spamassassin/bayes_seen -rw---1 mn users 5832704 Сен 18 14:25 .spamassassin/bayes_toks После обучения соответствующие сообщения можно удалить. В .spamassassin/bayes_seen лежат Message-ID сообщений во избежание повторного обучения на уже пройденном (в данном случае, повторение - не мать учения :-) -- /me @ home MAN-UANIC pgpGAeqiiYH8q.pgp Description: PGP signature
Re: SpamAssassin+russian spam
On Wed, 20 Aug 2003 02:11:32 +0300 Mykola A Nickishov (Mykola) wrote: Mykola Я делаю так: Mykola [EMAIL PROTECTED]:$ cat .procmailrc Mykola :0: Mykola * ^X-Spam-Level: \*\*\*\*\*\*\*\*\*\*\*\*\*\*\* Mykola spam-almost Mykola :0: Mykola * ^X-Spam-Status: Yes Mykola spam-probably Mykola Вторым правилом отбираются потенциально спамовые сообщения. Раз в сутки Mykola ящик spam-probably скармливается сюда: Mykola nice sa-learn --spam --mbox Mail/sa-learn-20030815-1 -D Я писал мылом Николаю, что-то ответа нет, тогда в рассылку, может быть кто-то подскажет? У меня есть свой домашний домен, который бы хотелось обрабатывать SA. При этом весь обнаруженный спам на этот домен заворачивать лично мне, а я его procmail-ом по аналогии с Николаем либо прибивать, либо в probably. В принципе нашёл доки с примерами для Exim 3, получилось то, что я хочу. Но есть у меня одно отличие - у меня вся почта в maildir для courier-imap. У sa-learn есть опция --dir, тогда можно его натравливать на что-то типа ~/Maildir/.spam/cur. Но у меня остаётся вопрос - нигде в доках не нашёл - можно ли удалять эти письма после запуска sa-learn, ведёт ли он свою базу знаний? Спасибо! -- Serge Olkhowik [EMAIL PROTECTED] ISD Configuration Management Team [EMAIL PROTECTED]
Re: SpamAssassin+russian spam
Hello Anatoly Pugachev, Once you wrote about Re: SpamAssassin+russian spam: On Fri, Aug 01, 2003 at 12:58:41AM +0400, Andrey Nekrasov wrote: Hello Andrey Andruschenko, Слишком уж много их проскакивает, вот только что, была месага - явный спам Так у нее был X-Spam-Status: -1.2 Явно, не слишком уж успешная фильтрация.Вот мне и интересно, КАК наиболее эффективно фильтровать русскоязычный спам ? версия spamassassin последняя? анализ по Байесу (кажется так) включен? у меня его база общая на всех пользователей. А кстати как сделано что база общая для всех? В /etc/mail/spamassassin/local.cf написано: bayes_path /var/spool/spamassassin/bayes -- Постучите по арбузу. Если вам ответят, не берите.
Re: SpamAssassin+russian spam
On Mon, Aug 04, 2003 at 09:48:29AM +0300, Alexander A. Vlasov wrote: А вот еще вопрос по СпамАссасину: как проверить, чему он научился и учится ли он вообще? В конфиге есть auto_learn 1 auto_learn_threshold_nonspam -2 auto_learn_threshold_spam 9 Но в отчетах по спаму очки начисляются по-прежнему... Я так понял, он должен обучившись переосмыслить фильтры и изменять кол-во очков, начисляемых за них, в зависимости от того, насколько часто фильтр дает срабатывание на спам? Или я неправильно понял? В любом случае, как проконтролировать его обучаемость? sa-learn -D ... ? -- Всё плохо, но очень любопытно, что же будет дальше pgpB08kEnVB52.pgp Description: PGP signature
Re: SpamAssassin+russian spam
On Thu, Jul 31, 2003 at 04:07:49PM +0400, Andrey Andruschenko wrote: Как-то Thu, 31 Jul 2003 14:30:19 +0400 Andrey Nekrasov [EMAIL PROTECTED] писал(а): Hello Andrey Andruschenko, Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения Основная проблема с Америкен Ленгвич Центр. Я их по телефонам ловлю, но не очень эффективно. Остальные вроде не проскакивают. :) -- И это тоже пройдет. Слишком уж много их проскакивает, вот только что, была месага - явный спам Так у нее был X-Spam-Status: -1.2 Явно, не слишком уж успешная фильтрация.Вот мне и интересно, КАК наиболее эффективно фильтровать русскоязычный спам ? Я делаю так: [EMAIL PROTECTED]:$ cat .procmailrc :0: * ^X-Spam-Level: \*\*\*\*\*\*\*\*\*\*\*\*\*\*\* spam-almost :0: * ^X-Spam-Status: Yes spam-probably Вторым правилом отбираются потенциально спамовые сообщения. Раз в сутки ящик spam-probably скармливается сюда: nice sa-learn --spam --mbox Mail/sa-learn-20030815-1 -D То, что прошло по такой цепочке в инбоксе замечено небыло ;) PS: предупреждаю - лучше пользовать spamd/spamc вместо spamassassin и spamd пускать с -d -c -a -m 5 -- ОБРЕЗ -- гладкоствольное еврейское ружье. pgpqZer70pRrA.pgp Description: PGP signature
Re: SpamAssassin+russian spam
On Fri, 15 Aug 2003 at 19:36:59 +0400, Anatoly Pugachev wrote: А кстати как сделано что база общая для всех? $ zless /usr/share/doc/spamassassin/README.spamd.gz The Bayesian Classifier --- If you plan to use Bayesian classification (the BAYES rules) with spamd, you will need to either 1. modify /etc/spamassassin/local.cf to use a shared database of tokens, by setting the 'bayes_path' setting to a path all users can read and write to. You will also need to set the 'bayes_file_mode' setting to 0666 so that created files are shared, too. 2. Alternatively, let the users train their individual Bayes database. We have implemented an auto-learning algorithm (option 'auto_learn', on by default) which can use high-scoring and low-scoring (options 'auto_learn_threshold_spam' and 'auto_learn_threshold_nonspam') mails to improve classification efficiency. -- alexander saltanov
Re: SpamAssassin+russian spam
Добрый день. А вот еще вопрос по СпамАссасину: как проверить, чему он научился и учится ли он вообще? В конфиге есть auto_learn 1 auto_learn_threshold_nonspam -2 auto_learn_threshold_spam 9 Но в отчетах по спаму очки начисляются по-прежнему... Я так понял, он должен обучившись переосмыслить фильтры и изменять кол-во очков, начисляемых за них, в зависимости от того, насколько часто фильтр дает срабатывание на спам? Или я неправильно понял? В любом случае, как проконтролировать его обучаемость? On Thu, Jul 31, 2003 at 01:59:51PM +0400, Andrey Andruschenko wrote: Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения -- WBR, Alexander A. Vlasov Topping Ltd.
Re[2]: SpamAssassin+russian spam
Привет Denis, 31 июля 2003 г. было написано: DD У меня такой конфиг пропускает не много спама и пока что посчитал DD спамом только одно нормальное письмо. DD # scores DD score SUBJ_FULL_OF8BITS 0.1 Должно быть SUBJ_FULL_OF_8BITS ^ Best regards, Alexander GQ Gerasiov [EMAIL PROTECTED] Кука: Время детское, а спать и есть уже хочется по-взрослому... np: [Chillout Moods] Compact Disc 6 -- Kate Price - The Isle of Dre..
SpamAssassin+russian spam
Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения -- UIN: 119944395 HP: http://mkaudio.sf.net/, http://fssg.st-oskol.ru/ Andrey Andruschenko, SOLUG/SOFSSG , инженер-программист, S.A. ЦентрТелеком, Старооскольский ГорПТУС
Re: SpamAssassin+russian spam
Hello Andrey Andruschenko, Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения Основная проблема с Америкен Ленгвич Центр. Я их по телефонам ловлю, но не очень эффективно. Остальные вроде не проскакивают. :) -- И это тоже пройдет.
Re: SpamAssassin+russian spam
Как-то Thu, 31 Jul 2003 14:30:19 +0400 Andrey Nekrasov [EMAIL PROTECTED] писал(а): Hello Andrey Andruschenko, Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения Основная проблема с Америкен Ленгвич Центр. Я их по телефонам ловлю, но не очень эффективно. Остальные вроде не проскакивают. :) -- И это тоже пройдет. Слишком уж много их проскакивает, вот только что, была месага - явный спам Так у нее был X-Spam-Status: -1.2 Явно, не слишком уж успешная фильтрация.Вот мне и интересно, КАК наиболее эффективно фильтровать русскоязычный спам ? -- UIN: 119944395 HP: http://mkaudio.sf.net/, http://fssg.st-oskol.ru/ Andrey Andruschenko, SOLUG/SOFSSG , инженер-программист, S.A. ЦентрТелеком, Старооскольский ГорПТУС
Re: SpamAssassin+russian spam
On Thu, Jul 31, 2003 at 04:07:49PM +0400, Andrey Andruschenko wrote: Как-то Thu, 31 Jul 2003 14:30:19 +0400 Andrey Nekrasov [EMAIL PROTECTED] писал(а): Hello Andrey Andruschenko, Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения Основная проблема с Америкен Ленгвич Центр. Я их по телефонам ловлю, но не очень эффективно. Остальные вроде не проскакивают. :) -- И это тоже пройдет. Слишком уж много их проскакивает, вот только что, была месага - явный спам Так у нее был X-Spam-Status: -1.2 Явно, не слишком уж успешная фильтрация.Вот мне и интересно, КАК наиболее эффективно фильтровать русскоязычный спам ? сорри, что не совсем про SpamAssasin.. Я пользуюсь SpamOracle. Натравил его на два ящика писем (примерно по 200 в каждом ящике), в одном - хорошие, а другом - спам. Он сформировал базу, и все. Я забыл о спаме почти. Если что то пролезает - добавляе к его базе и всего делов.. -- UIN: 119944395 HP: http://mkaudio.sf.net/, http://fssg.st-oskol.ru/ Andrey Andruschenko, SOLUG/SOFSSG , инженер-программист, S.A. ЦентрТелеком, Старооскольский ГорПТУС -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED] -- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Gerasimov Dmitry e-mail: dima AT polarcup DOT ru icq:26277841 =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= pgpgQOO4iJkWT.pgp Description: PGP signature
Re: SpamAssassin+russian spam
On Thu, 31 Jul 2003 16:07:49 +0400, Andrey Andruschenko(AA) wrote to debian: AA Слишком уж много их проскакивает, вот только что, была месага - явный AA спам AA Так у нее был X-Spam-Status: -1.2 AA Явно, не слишком уж успешная фильтрация.Вот мне и интересно, AA КАК наиболее эффективно фильтровать русскоязычный спам ? У меня такой конфиг пропускает не много спама и пока что посчитал спамом только одно нормальное письмо. =+== ok_locales en ru ok_laguages en ru rewrite_subject 0 report_header 1 use_terse_report1 defang_mime 0 skip_rbl_checks 1 chex_mx_attempts3 check_mx_delay 5 auto_whitelist_factor 0.5 # whitelist/blacklist addresses whitelist_from [EMAIL PROTECTED] whitelist_from [EMAIL PROTECTED] whitelist_from [EMAIL PROTECTED] whitelist_from [EMAIL PROTECTED] blacklist_from [EMAIL PROTECTED] blacklist_from [EMAIL PROTECTED] # scores score SUBJ_FULL_OF8BITS 0.1 score IN_REP_TO -0.1 score HTML_WITH_BGCOLOR 3.6 score CTYPE_JUST_HTML 3.9 score BIG_FONT 2.7 score MONEY_MAKING 2.0 score WEB_BUGS 0.2 score MAILTO_LINK 1.3 score MAILTO_WITH_SUBJ 1.6 score MAILTO_WITH_SUBJ_REMOVE 2.2 score MAILTO_TO_SPAM_ADDR 2.0 score PORN_11.353 score PORN_10 0.266 score PORN_11 0.879 score PORN_12 0.826 score PORN_13 4.194 score PORN_30.805 score PORN_41.491 score PORN_63.319 score PORN_71.514 score PORN_80.2 score PORN_92.692 score INVALID_DATE_ODD_MONTH1.9 score CHARSET_FARAWAY 2.0 score CHARSET_FARAWAY_HEADERS 1.8 score CHARSET_FARAWAY_BODY 1.9 score SUBJ_HAS_UNIQ_ID 2.5 score SUBJ_ENDS_IN_Q_MARK 0.2 score SUBJ_HAS_Q_MARK 0.5 score SUPERLONG_LINE0.9 score LINES_OF_YELLING 0.5 score LINES_OF_YELLING_20.7 score LINES_OF_YELLING_30.8 score NO_REAL_NAME 0.9 score TO_LOCALPART_EQ_REAL 0.8 score FROM_ENDS_IN_NUMS 1.0 score FROM_HAS_MIXED_NUMS 2.3 score SUBJ_ALL_CAPS 0.5 =+== -- Denis. Root - только для тех кто в правду крут !
Re[2]: SpamAssassin+russian spam
Привет Andrey, 31 июля 2003 г. было написано: AN Hello Andrey Andruschenko, Привет Поделитесь пожалуйста опытом по фильтрации рускоязычного спама при помощи SpamAssassin, и/или набором фильтров Я так понимаю, что изначально он заточен для фильтрации спама англо- и еще_что-то_там - язычного ? Речь естественного идет о проверке тела сообщения AN Основная проблема с Америкен Ленгвич Центр. Я их по телефонам ловлю, но не очень AN эффективно. Так эти уроды теперь пробелы повсюду ставят :) Впору через каждую букву/цифру писать [ ]* в регекспах Best regards, Alexander GQ Gerasiov [EMAIL PROTECTED] Кука: Билл Гейтс финансирует экспедицию к Южному полюсу. Цель экспедиции - массовое истребление пингвинов... np: Chillout Moods - Paban Das Baul and Sam Mills.. [stopped]
Re: SpamAssassin+russian spam
Hello Andrey Andruschenko, Слишком уж много их проскакивает, вот только что, была месага - явный спам Так у нее был X-Spam-Status: -1.2 Явно, не слишком уж успешная фильтрация.Вот мне и интересно, КАК наиболее эффективно фильтровать русскоязычный спам ? версия spamassassin последняя? анализ по Байесу (кажется так) включен? у меня его база общая на всех пользователей. -- И это тоже пройдет.