Newsletter von Ritlabs landen im SPAM-Filter

  • Hi!

    Alle Newsletter die ich bisher von Ritlabs gekriegt habe sind im Bayes-Filter von Achim hängen geblieben. Und das obwohl ich jede Mail dann einzeln als Ham klassifiziert hab.

    Der serverseitige SpamAssassin hat übrigens bis auf den fehlenden Realname nichts daran auszusetzen:

    Zitat


    X-Spam-Checker-Version: SpamAssassin 2.61 (1.212.2.1-2003-12-09-exp) on
    [gelöscht]
    X-Spam-Level:
    X-Spam-Status: No, hits=0.3 required=9999.0 tests=NO_REAL_NAME autolearn=no
    version=2.61

    Wozu dient denn die "Als Nicht-Spam klassifizieren"-Option wenn das Zeugs doch wieder gefiltert wird? :denk:

    PS: Ja, ich kenne die Whitelist. Es sollte doch aber auch so zu schaffen sein.

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

  • So wie ich das sehe klassifiziert dein SA (hier) nach Regeln und nicht nach Bayes.

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Richtig, ich hab ja auch vom Bayes-Filter-Plugin von Achim gesprochen ;)

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

  • Hier mal eine solche Mail, die trotz "Als Nicht-Spam klassifizieren" gefiltert wird.

    Bitte nach *.msg umbenennen!

    Caschy sagt: Man muss dass auch als *.zip oder so packen, damit alle was davon haben. Try it again

    Doenerbude sagt: Man sollte mal dazuschreiben welche Dateitypen erlaubt sind. Dann muss man nicht ewig probieren :pfeif:

    [gelöscht durch Administrator]

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

    Einmal editiert, zuletzt von Doenerbude (29. April 2004 um 19:37)

  • Zitat

    Hier mal eine solche Mail, die trotz "Als Nicht-Spam klassifizieren" gefiltert wird.


    das teil allein sagt nichts aus!!! ich bräuchte auch deine datenbank, sowie die white bzw. blacklist files. alternativ kannst du das teil ja mal durch den filter jagen und dabei verbose logging anmachen. dann kann ich dir sagen weshalb das gefiltert wird.

    achim

    hab mir gerade die mail angesehen und muss sagen, dass ist kein wunder das die als spam erkannt wird. wortgruppen wie: "free of charge" und "unsubscribe" usw. kommen in jeder zweiten spam mail vor. da wirst du mit jedem bayes filter ein problem haben und daran laesst sich leider auch nichts machen.

    Einmal editiert, zuletzt von mumpitzstuff (29. April 2004 um 21:24)

  • Wenn ich das Ding als "Nicht-Spam" markiere erwarte ich eigentlich das sowas künftig nicht mehr gefiltert wird :-/

    Oder habe ich da das Prinzip eines Bayes-Filters noch nicht so ganz verstanden? :denk:

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

  • Zitat

    Oder habe ich da das Prinzip eines Bayes-Filters noch nicht so ganz verstanden? :denk:


    Japp, so ist es... :pfeif:

    Der Bayes gibt jedem Wort einen Prozentwert.
    Wie Achim schon sagt, bekommen so Wörter wie 'free of charge' wohl nahezu 100%.

    Würden die aufgrund Deiner Newsletter-Reklassifizierung klassifizierten Mails dann weniger Gewicht bekommen, rutschen richtige Spam-Mails natürlich durch. :thumbdown:

    Du könntest diese Adresse ja in die Whitelist aufnehmen - dafür ist diese ja auch da... :punk:

    Thunderbird Add-on Clean Subject: Aneinanderreihungen von Präfixen ("Re: AW: Re: AW:") oder Kürzel wie "[SPAM]" oder "****SPAM****" automatisch entfernen.

    Einmal editiert, zuletzt von Manu (29. April 2004 um 23:05)

  • Zitat

    Oder habe ich da das Prinzip eines Bayes-Filters noch nicht so ganz verstanden? :denk:


    hallo,

    die mail wird auch aus der wort liste wieder entfernt, das ist schon richtig. das problem ist nur, dass bestimmte wörter bereits 100-200 mal in spam mails vorkommen. wenn ich nun aus 100 eine 99 mache und bei ham aus der 0 eine 1, so wird sich an dem endergebnis so gut wie nichts ändern! für sowas müsste man vielleicht von spam assassin regeln zufügen und beide ergebnisse gewichten. das ist aber jede menge arbeit. reine bayes filter werden immer daran scheitern.

    achim

    PS: an alle: gibt es vielleicht ein projekt das die spam assassin regeln bereits implementiert? bisher ist mir sowas unbekannt.

  • komisch ich kann nicht mir zitieren...

    also das regelwerk sieht recht übersichtlich aus. ausserdem kann das plugin die regular expressions ohne probleme auswerten. ich muesste nur noch das drumherum implementieren... naja das dürfte aber zeit fressen. zuerst will ich mal den zweiten bayes algorithmus implementieren. dann mach ich vielleicht noch das andere rein. danach sollte eigentlich nichts mehr schief gehen. ;)

    achim

  • Zitat

    also das regelwerk sieht recht übersichtlich aus. ausserdem kann das plugin die regular expressions ohne probleme auswerten.


    Aktuell geht das nicht. Ich habe das schon probiert. Irgendwas ist mit deinem Syntax.

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Stimmt, habe es auch mehrfach getestet. Gibt Fehlermeldungen bzgl. des Syntax.

    Achja, nach dieser Syntax-Fehlermeldung (mehrere) wird der Inhalt der Blackliste seltsamerweise automatisch KOMPLETT gloescht.

  • Zitat

    Stimmt, habe es auch mehrfach getestet. Gibt Fehlermeldungen bzgl. des Syntax.

    Achja, nach dieser Syntax-Fehlermeldung (mehrere) wird der Inhalt der Blackliste seltsamerweise automatisch KOMPLETT gloescht.


    was genau hast du denn probiert? gib mir doch mal einen ausdruck der nicht geht...
    das mit der blacklist werde ich mir ansehen...

    achim