Moin, moin!

Sieht so aus als wird mein Vortrag beim Listentreffen einigermassen 
relevant sein :-)

> > hat jemand eine idee, wie man einen spam-filter realisiert? 
> > ich rufe mittels jmail emails ab und speichere sie in einer 
> > datenbank ...
> > will alle verd�chtigen spams in einen extra ordner ablegen ...
> 
> Kommt darauf an was f�r dich "verd�chtig" ist ...
> Die grossen Hersteller r�cken halt meistens ihre Algorithmen nicht
> raus... Du solltest auf jeden fall vorsehen bestimmte absender- oder
> domainen-listen als spam anzusehen... Du k�nntest auch die
> �ffentlichen listen von spammern nutzen, aber da wird wohl einem
> VBS-Skript ziemlich schnell die puste ausgehen.. Einige spam-mails
> haben auch viele leerzeichen im subject und dann hinten noch ne nummer
> oder ein code o.�. Oder du benutzt worte und/oder phrasen, die spam
> auszeichnen, z.B. "MAKE MONEY FAST" o.�. Manchmal hilft auch der
> header... Schau dir mal ein paar spam-mails an...
> 
> Du kannst auch versuchen die methode intelligent zu machen und nur bei
> zusammentreffen von mehreren merkmalen die mail endg�ltig als spam zu
> qualifizieren..
> 
> Es hilft sicher wenn man dazu ein paar tausend mail - spam und
> nicht-spam - zu haben und damit die routinen zu testen... Man will ja
> m�glichst auch keine falschen raussortieren..

Die reinen Stichwortfilter sind zu aufwendig und liefern relativ viele 
Fehlalarme. Headeranalyse ist eine gute Idee, kann aber auch schief 
gehen, bzw. ist zu aufwendig (DNS-lookups etc.) Statistische 
Ans�tze sind wesentlich besser geeignet. Blacklists alleine sind zu 
brutal, da sie meist unschuldige User im selben IP-block mit killen, 
also eher mit Whitelists arbeiten. Am besten ist eine Kombination 
aus verschiedenen Ans�tzen, so wie sie SpamAssassin praktiziert. 
Kann man wenigstens von klauen weil Open Source :-)
Findet sich hier:

http://www.spamassassin.org

Geht sowohl serverseitig als auch clientseitig einzusetzen. Eine 
andere Implementation als clientseitiger pop3-proxy ist SAProxy, hier 
zu finden:

http://saproxy.bloomba.com/

Wird von Chris, Herbert und mir erfolgreich verwendet. Gibt auch 
noch Spambayes als neuesten:

http://saproxy.bloomba.com/

Theorie zum Thema Spamfiltern findet sich hier:

http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html
http://radio.weblogs.com/0101454/stories/2002/09/16/spamDetection
.html
http://spambayes.sourceforge.net/background.html

So, das sollte mal vorl�ufig gen�gen..

Ciao,

            Bernd

Kent Beck is a wimp. *Real* Extreme Programming is when you write 
Perl code 
on a toxic waste dump.

~~~~~~~~~~~~~~~~~~~~~~~~~~~sponsored by United Planet~~~~~~~~~~~~~~~~~
Kaffeepause im United Planet Communityserver ...
http://www.intrexx.com/communityserver                         
_______________________________________________
Coffeehouse mailing list
[EMAIL PROTECTED]
http://www.glengamoi.com/mailman/listinfo/coffeehouse

Antwort per Email an