Wieviele SpamMails in Datenbank?

  • Hi,

    Ich habe Bayesfilter nach der Installation mit ca. 3000 SpamMails und ca. 1000 HamMails versorgt. Das Scannen hat ne halbe Ewigkeit gedauert. :) Trotzdem liegt die Erkennungsrate bei ca. einem Prozent. (Heute von 84 SpamMails eine erkannt.)Hat jemand ne Ahnung, was ich falsch gemacht habe?

    Danke.

    Edit: Mist. Jetzt kann ich den Krampf im Betreff des Beitrags nicht mehr ändern. Sorry. :rolleyes:

    Wraith.

    Einmal editiert, zuletzt von wraith (18. Juni 2004 um 18:24)

  • Zitat

    was für einen rechner hast du und war die datenabnk vorher leer?


    Rechner: P3 600, 256 MB RAM, Win2KSP4, TheBat! 2.11, BayesFilter 1.3.2

    Ja, Bayesfilter hat sich über eine leere Datenbank beschwert und mich aufgefordert ihn mit Spam und Ham zu füttern. BayesFilter war allerdings schon mal, in einer früheren Version, installiert. Ich habe aber alle Ordner gelöscht. Ich war damals zu Bayesit zurück gewechselt, da die Filterergebnisse ähnlich zu heute waren.

    Ich hänge mal einen Screenshot der Statistiken an. Ich hatte sie vor dem letzten Mailabrufen resetet, da sie Unsinn anzeigte. Ich nehme aufgrund der vielen false negatives an, das die Zahl der false positives nur auf null steht, da ich nur Mails von Leuten empfangen habe, die in meiner Whitelist stehen.


    wraith.

    [gelöscht durch Administrator]

    Einmal editiert, zuletzt von wraith (21. Juni 2004 um 16:02)

  • hallo,

    da laeuft auf deinem rechner etwas grundsätzlich schief. bestimmt hast du etwas in der black-/whitelist stehen das dafür sorgt, dass nichts bzw. falsch erkannt wird. schalte doch mal das verbose logging ein, setz die groesse der log datei auf 200.000 und schau dir dann das logfile an. eventuell schick mir mal die datenbank und ich werfe einen blick drauf.

    achim

  • Zitat

    da laeuft auf deinem rechner etwas grundsätzlich schief. bestimmt hast du etwas in der black-/whitelist stehen das dafür sorgt, dass nichts bzw. falsch erkannt wird.


    Das mit dem schieflaufen stimt. :lol:

    Du hast recht. Wahrscheinlich war es ein falscher Audruck in meiner Whitelist. Ich habe, nach vielem Rumsuchen im Netz nun wohl einen korrekten RegEx-Ausdruck für meine Whitelist gefunden. Ich muss nämlich sicherstellen, dass zumindest die Mails unserer Firmendomain auf keinen Fall gefilter werden. "From:\s*.+Firmenname.com" scheint zu funktionieren. Ich werd' das in den nächsten Tagen mal im Auge behalten.

    Mir sind durch dieses Problem drei Dinge aufgefallen. Wenn die schon umgesetzt und irgendwo beschrieben sind, dann so, dass man sie als Normalnutzer nicht findet.

    1. Ein Verweis auf eine (korrekte) RegEx-Anleitung in der BayesFilterAnleitung wäre toll. Noch besser wäre ein kleiner Editor, der es einem erlaubt, einfache Suchmuster zu benutzen, ohne RegEx zu verstehen. Sowas, wo man per dropdownbox und Textfeld schon mal einfachste Operationen einführen kann.

    2. Der Plugin sollte regelmässig alle Einträge des Adressbuchs in die Whitelist (oder zwecks übersichtlichkeit eine seperate Liste) aufnehmen.

    3. Klasse wäre auch ein Verweis auf eine Seite, die DNS-BLs erklärt und auflistet.

    wraith.

  • hallo,

    1.) dafür gebts eigentlich genügend programme die sowas bereits machen. ich werde aber den hinweiss aufnehmen und versuchen dahingehend einige links in die hilfe aufzunehmen.

    2.) das geht nicht, da ich über das plugin interface keinen zugriff auf das addressbuch habe.

    3.) das werde ich ebenfalls in die hilfe aufnehmen.

    achim

  • Zitat

    Ein Verweis auf eine (korrekte) RegEx-Anleitung in der BayesFilterAnleitung wäre toll.


    Regenechsen.de

    Zitat

    Noch besser wäre ein kleiner Editor, der es einem erlaubt, einfache Suchmuster zu benutzen, ohne RegEx zu verstehen. Sowas, wo man per dropdownbox und Textfeld schon mal einfachste Operationen einführen kann.


    Damit wirst du wohl nie auf ein vernünftiges Ergebnis kommen. Dafür sind RegExp viel zu kompliziert aufgebaut...und ich verwend sie jetzt auch schon seit ein paar Monaten ;)
    Lies lieber die Anleitung unter dem oberen Link durch und nutze ein RegExp-Programm alá RegExTester (nehm ich nur) oder RegEx-Coach (mit grafischer Oberfläche über die Struktur eines RegExps).

  • Zitat

    2.) das geht nicht, da ich über das plugin interface keinen zugriff auf das addressbuch habe.


    Das ist doof, aber natürlich nicht Deine Schuld. :D

  • Zitat

    Regenechsen.de

    (...)

    Lies lieber die Anleitung unter dem oberen Link durch und nutze ein RegExp-Programm alá RegExTester (nehm ich nur) oder RegEx-Coach (mit grafischer Oberfläche über die Struktur eines RegExps).


    Regenechsen hatte ich dann auch schon gefunden. Die Anleitung ist aber für die White-/Blacklist-Benutzung in Bayesfilter zu umfangreich. Ihr müsst bedenken, dass der Plugin ja auch von Leuten benutzt werden soll, die weder die Geduld, noch das Verständniss aufbringen um diese grundlegenden Erklärungen in einen einfachen Abesenderadressenfilter in der White-/Blacklist umzusetzen.

    Ein Hinweiss auf diese Tools wäre auch hilfreich gewesen.


    wraith.

  • Zitat

    Die Anleitung ist aber für die White-/Blacklist-Benutzung in Bayesfilter zu umfangreich.


    RegExp ist umfangreich.

    Außerdem braucht der "normale" Anwender am Anfang eh kein RegExp, ganz einfach aus zwei Gründen:
    1. Blacklist ist hinfällig, da Spammer die Absenderadresse fälschen und immer wieder eine andere nehmen.
    2. Die Whitelist kann man ganz einfach auffüllen wenn in der Hilfe ein paar Beispiele stehen. Der Syntax ist ja nicht weiter schwer, name@provider.de filtert auf die genaue Adresse, @provider.de filtert auf eine ganze Domain...mehr braucht eh fast niemand, oder?

    Zitat

    Ein Hinweiss auf diese Tools wäre auch hilfreich gewesen.


    Hab ich doch gegeben...oder meinst du in der Hilfe des Plugins? ;)