Jag har kört Bogofilter i snart ett år med stor framgång. Något enstaka mail har då och då felaktigt klassificerats som ham. Inte en enda gång har ett mail felaktigt klassificerats som spam. Jag får ca 1000 spam i månaden så jag har ganska många mail att träna Bogofilter med.
För någon månad sedan hände något. Massor av spam slipper igenom. Uppskattningsvis missar Bogofilter 10-20% av alla spam nu. Har någon annan upplevt samma sak? Har spammarna hittat på något nytt sätt som lyckas lura statistiska filter? Ett väldigt frekvent spam just nu handlar om "powerful weightloss". Bogofilter klassificerar detta enl: X-Bogosity: No, tests=bogofilter, spamicity=0.000000, version=0.91.0 Trots att det innehåller massor av text som borde trigga filtret. Längs ner ligger dock detta: ***** Start SPAM text ***** ---- system information ---- Japan images contents alone invoke could formatting some all area individual Exchanging W3C culturally Publication yet writing Group's XML radical-stroke similar-looking problem hidden Task members publication internationalized tag manner [WSUS] covered Preferences years display difficult its of Specifying describing imply ***** Slut SPAM-text ***** Det verkar som om spammarna lägger in ett antal "ovanliga spam-ord" för att lura statistiska filter. -- Mikael Bergman <[EMAIL PROTECTED]>