BayesFilter: Butter bei die Fische....

  • So, jetzt mal hier und jetzt die ultimative Frage:
    - Wie bediene ich den BayesFilter richtig?

    Hintergrund der Frage:
    - immer wieder bekomme ich Spam-Mails mit Wortlauten, die ich schon zig-mal als Spam markiert habe in den Posteingang.

    z.B. sowas hier:

    Zitat


    Hi,
    We sent you an email a while ago, because you now qualify for a new mortgage.
    You could get $300,000 for as little as $700 a month!
    [....usw usw...]


    bekomme ich mit boshafter Regelmäßigkeit immer wieder in eines meiner Postfächer. Und ich habe diese Mails (die fangen immer genau gleich an) schon bestimmt 5-8x mit "Mark as Spam" in den Junk Mail Folder verschoben... warum flutscht sowas immer wieder durch?

    Als Empfänger steht meine korrekte Mail-Adresse drin (sage ich mal dazu, weil es einen Thread gibt in dem dies als mögliche "Fehler"-Quelle benannt wird)

    Überhaupt ist es so, dass ich von 10 Spams bestimmt 5-8 selber wegsortieren muss weil der Filter sie einfach nicht packt.

    Ich glaube jetzt ja wirklich vieles - aber nicht, dass der Spam-Filter so blind sein soll - dagegen spreche viele Erfahrungsberichte hier. :)


    Wie genau muss ich jetzt also vorgehen, damit der Filter auch wirklich richtig gut filtert?
    Muss ich für jede Spam die kommt auch eine Ham als Ham markieren?
    Muss ich meinen gesamten Mailbestand als Ham markieren?
    Warum erkennt der Filter solche Spams immer wieder nicht - wie und wo kann ich das prüfen um bei der Ursachenforschung zu helfen?

    (ich hasse solche Vergleiche aber ich muss es sagen) K9 hat schon nach wenigen Tagen (nur wenige Spams) Spitzen-Filterergebnisse geliefert - was macht der anders? (und nein, ich möchte nicht K9 auf dem Speicher-Stick nutzen - da ist mir das PlugIn lieber)

    Vielen Dank bei der Ursachenforschung

    nSonic

  • Ich kann wohl nichts zu dem Bayesfilter sagen , aber bei mir flutschten auch immer die selben Mails durch den BayersIT, deswegen nehme ich wieder K9!

    Auch in der neusten c´t 15/04 wird TB sowie auch K9 getestet!
    softlink 0415146

    K9 schloss mit Spamihilator am besten ab!
    Bei der Erkennungsrate sogar 1 ter.

    Ich nehm die geringe Speichermehrbelatung durch K9 sehr gerne in kauf.

    Dafür habe ich aber von Spams die Ruhe!

    PlugIn hin oder her, ich hatte immer Probleme mit der Konfiguration und der Transparenz von BayesIT!

    caschy hat recht!
    K9 ist bei mir Ungeschlagen!

    Wenn du glaubst,du schaffst es oder du schaffst es nicht:Du wird auf jeden Fall Recht behalten!" (Henry Ford )
    Die Psychologen nennen das 'die sich selbst erfüllende Prophezeiung'.

    Einmal editiert, zuletzt von Leeroyy (19. Juli 2004 um 19:10)

  • BayesIT hat bei mir nie wirklich funktioniert... immer nur mal kurz.

    Deshalb ja den BayesFilter - der funktioniert ja "im Prinzip" - aber es flutschen wirklich extrem viele durch... nur warum?

    nSonic

  • Oh - bin untröstlich :blink: :pfeif:

    ich hatte es extra noch gesucht (auf der Startseite) - hab ich wohl übersehen :doh:
    Ich gelobe Besserung :thx:

    nSonic

  • hallo,

    das ist eigentlich eine frage des trainings des filters. am besten du machst mal eine saubere datenbank und trainierst den filter neu. wenn immer eine mail durchrutscht, nicht einfach löschen oder verschieben, sondern immer vorher mit mark as spam oder mark as not spam markieren und dann verschieben oder loeschen!!! das ist sehr sehr wichtig! ausserdem kannst du wenn immer die selben mails kommen ein schlüsselwort aus der mail in deine blacklist aufnehmen und hast so das problem gelöst. wenn weiter probleme auftreten, dann frag einfach noch mal.

    achim

  • Wie erzwinge ich am einfachsten den Aufbau einer neuen Datenbank?

    Wie trainiere ich den Filter am besten? Nur spams markieren? Oder für jede Spam auch eine Ham markieren?

    Hinweis: ich lösche niemals einfach nur so (wenn es spam ist) sondern gehe immer über "Mark As Spam" und dann wird die Mail automatisch in den globalen junkmail-Folder verschoben

    nSonic

  • wenn du die datenbank neu erzeugen willst, so lösche einfach das datenbank file und trainiere das plugin neu. am besten du trainierst erst die spam mails und dann die ham mails, so kommt man nicht durcheinander. einfach mails markieren und mark als spam oder mark as not spam markieren.
    das mit dem markieren meine ich auch bei als spam erkannten ham mails, da ist das ganz besonders wichtig!

    achim