Spam in Grafiken verpackt (mit Zufallstexten um bayessche Filter zu umgehen)

  • Hallo,

    wir kennen es alle: der Kampf gegen die Spammer ist ein Katz-und-Maus-Spiel. Sobald die Filter verbessert werden, reagieren auch wieder die Spammer darauf, um diese zu umgehen.

    Nachdem mein bayessche Filter inzwischen ziemlich gut trainiert war, kommt es in letzter Zeit immer häufiger vor, dass Spam durchkommt. Warum? Die Spammer packen ihrer Texte in Grafiken, die nicht vom Filter gelesen werden können und fügen dann beliebigen Zufallstext ein, mit dem der Filter natürlich nichts anfangen kann.

    Gibt es schon Plugins, die die Grafiken analysieren? Auf Basis von OCR z.B.?

    Weiterhin noch eine Frage an diejenigen, die sich vielleicht ein wenig mit der Programmierung von bayesschen Filtern auskennen: Wenn ich die Filter mit diesen Zufallstexten trainiere, steigt dann die Wahrscheinlichkeit, dass Ham fälschlicherweise erkannt wird? Oder gehen die Zufallswörter als "statistisches Rauschen" unter, da sie ja mehr oder wenig zufällig sind?

    Wie handhabt ihr diese neue Art von Spam??

  • Ich nutze AntispamSniper 1.8.0.5 und bin mit der Filterung sehr zufrieden. Ca. 200 Spammails habe ich fürs Antrainieren genommen, seitdem läuft das Plugin schon über zwei Monate. 919 Spammails erkannt, nur 18 musste ich nachträglich verschieben. Das macht 2%, also eine vertretbare Quote - gerade bei meinem noch relativ geringen Spamaufkommen.

    Auch die Mails mit Graphik drin werden sehr gut erkannt und mit 75-100% Spamrate erkannt. Der Filter ist aber nicht rein Bayes-basiert, sondern nutzt Filterregeln, die man auch ergänzen kann. Ich bin sehr begeistert. :D Frage mich, wie ich solange ohne Spamplugin auskommen konnte... automatisches Verschieben spart doch Zeit.