Bayes Filter Plugin 1.3.2b (Open Source)

  • Hello,

    i decided to release a new version of my antispam filter plugin. The
    following features are new:

    - faster loading of the database
    - scanning speed improvements
    - new undo system
    - logging function with logfile viewer
    - new black-/whitelisting handling
    - black-/whitelist editor
    - faster dns blacklist filtering
    - new hash algorithm for faster database handling
    - autoinsert black-/whitelist function
    - some parser improvements
    - some bugfixes

    Just download the new version from:
    http://www.lkcc.org/achim/download/bayesfilter.zip

    Be sure that you delete your old word database and undo database
    (below v1.3) before you start the new plugin. Now you have to retrain
    it and it is ready. If you want to keep the old database load it with
    any editor and add 100000 as first line of the file, so that the first
    three lines are numbers now.
    To improve the speed of the dns filtering set the max. threadcount to
    something like 40-50! I read somewhere that the count of significant
    words is to low. Try a value of 150 instaed of 20 to get hopefully
    better results.
    Users with Secure Bat! should set the registry value SpamScore to the
    same value like the settings "move a message to junk folder if score
    is greater than"!

    New ideas are always welcome. Mail them all!

    Best regards,

    Achim Winkler (achim@lkcc.org)

  • Hallo Caschy,

    auf http://www.batworld.de/modules.php?op=modl...order=0&thold=0 schreibst Du:

    Zitat


    Vor der Installation der neuen Version bitte unbedingt die alte Wort,- und Undo-Datenbanken löschen.


    Achim schreibt in seiner Ankündigung:

    Zitat


    Be sure that you delete your old word database and undo database
    (below v1.3) before you start the new plugin

    Ähm, was denn nun? Grundsätzlich löschen oder nur wenn älter als v1.3???

    Wenn ich jedes mal die Wortdatenbank löschen muss und das Plugin neu trainieren muss, wenn es eine neue Version gibt, dann ist ein erfolgreicher Einsatz dieses PlugIns wohl mehr als fragwürdig!
    Die wortdatenbnk lebt doch davon, dass Sie mit meinen täglichen Mailaufkommen gefüttert wird. Sprich je länger desto genauer. Wenn ich die allerdings dauernd löschen muss, wird die ja nie richtig "klug".

    -piktor-

  • Hallo caschy,

    nochmals ich ;)

    danke für die schnelle Auskunft!

    und Entschuldigung für den etwas rauen Ton :rolleyes:

    ... mich ärgert nur gerade ein Spammer und ich bin jetzt mal den harten Weg über Denic und den Landesdatenschutzbeauftragten gegangen

    -piktor-

  • Zitat

    und Entschuldigung für den etwas rauen Ton


    Hab ich nirgends gelesen :) .

    Zitat

    mich ärgert nur gerade ein Spammer und ich bin jetzt mal den harten Weg über Denic und den Landesdatenschutzbeauftragten gegangen

    Würdest du das Forum bitte mal aufklären, was du wie gemacht hast, und was dabei herauskam? Das interssiert garantiert viele hier.

    Solltest es aber im Offtopic schreiben. Danke :thumbup: .

    MfG
    caschy

  • Oder wenn man die Datenbank behalten will einfach das machen was Achim schreibt:

    Zitat


    If you want to keep the old database load it with
    any editor and add 100000 as first line of the file, so that the first
    three lines are numbers now.


    ;)

    Gruß,
    Dönerbude, das neue Plugin installierend

    Nachtrag: Update hat 1a geklappt und die 10 Spams die grad reinkamen wurden gleich erkannt. Auch das "Als Spam/Ham klassifizieren" klappt.
    Die Erkennungsgenauigkeit, Stabilität etc kann ich natürlich erst in einigen Tagen beurteilen :punk:

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

    Einmal editiert, zuletzt von Doenerbude (25. Mai 2004 um 21:51)

  • hi,

    grundsätzlich kann natürlich die alte datenbank beibehalten werden. nur bei älteren versionen ist das format wegen der einen zahl am anfang etwas anders, deshalb kann es da zu problemen kommen. wenn man allerdings die alte datenbank weiter verwendet, so muss man sich darüber im klaren sein, das verbesserungen beim parsing von mails sich nicht in der datenbank wiederspiegeln. Dies wiederum ist nur von bedeutung, wenn jemandem die erkennungsrate des plugins zu gering ist.
    aehm uebrigens den text gibts nicht in deutsch. ich handele im moment nach dem prinzip der gleichheit, weshalb alle das selbe bekommen. ;) andere nennen es auch das prinzip der faulheit, dass ist jedem selbst überlassen...

    achim

  • Thanks for posting the annonuncement in english (also) :thumbup:
    I have a question probably it can caused by Bayes...

    New mail(s) arrives than It is automatically moved to the junkmail folder (I use common junkmail folder) but this junkmail had not been deleted from the server

    I have already tested the latest beta 8 but I think this is caused by the plugin,
    correct me if it isn't

    thanks
    Gabor @ hungary

  • Zitat

    I have already tested the latest beta 8 but I think this is caused by the plugin,
    correct me if it isn't


    hello,

    this has nothing to do with the filter. this is definitly a bug in the bat! i think the bayesit author reported it already to the ritlabs developers but im not sure about it.

    achim

  • Hallo Achim,
    ähm sag mal, kann sein dass in der neuen Version die DNS-Blacklisten nicht mehr funktioniert?
    Seitdem ich die neue Version nutze, gibt es in der Logdatei keine Einträge mehr mit "dns-blacklisted" und das erscheint mir doch irgendwie unwahrscheinlich.
    Ich bekomme pro Tag im Durchschnitt 50 Spammails, und die hauptsächlich in englisch, da ist es doch unwahrscheinlich, dass davon keine mit den DNs-Blacklisten übereinstimmt?

    Danke schon mal!

    -piktor-

  • hi,

    kann ich leider im moment nicht überprüfen, ich fahre die nächsten zwei wochen in den wohlverdienten urlaub.
    danach setze ich mich ran.

    achim

  • Hi!

    Erhol Dich gut!

    Ich hab dann noch nen Bug wenn Du wieder da bist: Wenn man ein Verzeichnis mit mehreren Spams (Beispiel: 30) drin hat und diese als Spam klassifizieren tut so schreibt Dein Plugin "Allready scanned mails: 30" hin obwohl noch gar nicht alle durch sind.

    Ein Auto hat einen Platten. Woran erkennt man, dass der Fahrer Informatiker ist?
    Ganz einfach: Er überprüft, ob der Fehler auch an einem anderen Reifen auftritt.

  • Zitat

    hi,

    kann ich leider im moment nicht überprüfen, ich fahre die nächsten zwei wochen in den wohlverdienten urlaub.
    danach setze ich mich ran.

    achim


    :o

    also ich habe keine Urlaubsschein unterschrieben :pfeif:

    nein, nein ... Spaß beiseite, ich wünsche Dir einen erholsamen Urlaub, fernab jeglichen Spams :-))) :bye:

    -piktor-

  • sorry for spamming this forum with my english but I could not find any (good) english forum about TheBat!

    If I move a mail (with drag&drop or with filter) to another account the attachment will not be copied or moved :denk: Am I right? Is it a small bug?

  • Zitat

    sorry for spamming this forum with my english but I could not find any (good) english forum about TheBat!

    No problem - you can speak english here:).

    But this is not an error with theBayes Filer-Plugin. I have no problems with copying mails with attachments into another folder...

    Einmal editiert, zuletzt von caschy (31. Mai 2004 um 23:37)

  • Zitat

    Wenn man ein Verzeichnis mit mehreren Spams (Beispiel: 30) drin hat und diese als Spam klassifizieren tut so schreibt Dein Plugin "Allready scanned mails: 30" hin obwohl noch gar nicht alle durch sind.


    ich glaub das haengt mit den threads zusammen die parallel abgearbeitet werden. ich muss mal schaun ob er die mails zählt bevor sie wirklich abgearbeitet sind. danke für den hinweiss ich werds überprüfen.

    achim

  • Hi,

    muss sagen, bin hochzufrieden mit der neuen Version! :)

    Die Erkennungsrate ist deutlich besser (habe wie empfohlen neue Datenbanken erstellt) als bei der alten Version. :thumbup:

    Und der Logfile-Output ist jetzt echt super, die Ausgabe des Scores ermöglicht es nun, die Spam-Grenze in TheBat! sowie die SPAM/HAM-Learning-Grenzen effektiv zu setzen.

    Keep up the good work!

    Viele Grüße,
    Fips