...so viel spam...

  • Moin

    Ich hab gestern endlich Zeit dazu gefunden und alle relevanten Dateien (database.dat, undo.dat, whitelist.dat, blacklist.dat und bayesfilter.dat (filters.dat hatte ich nicht)) geloescht um nochmal ganz von vorne anzufangen.
    Ich hab BayesFilter meinen Spam-Ordner zu futtern gegeben und danach kontrolliert, es waren in den Stats genau die gleiche Anzahl an erlernten Spam Mails (circa 3100).
    Danach hab ich Ham markiert, circa 1300 Mails. Danach nochmal in den Stats nachgeschaut, es waren keine als Spam erkannten Mails dazugekommen, also alles bestens, nicht ausversehen Ham als Spam lernen lassen (meine Vermutung fuer meine Probleme bisher). Vorhin Mails abgeholt und alles wurde wieder als Spam erkannt. Hab das verbose logging an, hier beispielhaft von einer 12 kb grossen Ham Mail das Log (Mail-Addy is unkenntlich gemacht):

    Wie ist das log zu lesen? Welche Worte haben den Ausschlag gegeben, dass sie als Spam erkannt wurde? Die Worte, die ganz oben stehen?

    Ich hoffe, dass der Filter denn bald mal wieder richtig bei mir funktioniert, bisher war ich immer recht begeistert davon...

    Danke!

    Citizen

  • also ich glaube ich weiss woran es liegt. es werden zu viele worte in die berechnung des spam wertes einbezogen. stell mal die significant words auf 20 runter. du scheinst da einen sehr sehr hohen wert zu haben. das ist definitiv falsch!!! gib mir bescheid was dann passiert...

    achim

  • Hi

    significant words stand auf 150, hab ich auf 20 runtergesetzt und nach wie vor werden alle ankommenden Mails als Spam erkannt, hier das verbose log einer der Mails (Absender hab ich mal auf egal@irgendwo gesetzt):

    Hmm... und nu? :denk:

    Citizen

  • aeh??? der rechnet bei dir völlig falsch. schau doch mal in der registry nach auf was für ein wert algorithm steht. oder besser noch, du löschst die einstellungen des plugins in der registry (the bat vorher schliessen). trainierst dann das plugin, und lässt es mal mit den standardeinstellungen laufen. du hast das was komplett falsch eingestellt ist meine vermutung. wenn du das schaffst, dann mach mal ein backup von dem registry pfad der einstellungen und hänge das an eine antwort an. mein mailserver und auch meine webpage scheinen seit gestern total abgestürzt zu sein.

    achim

  • Moin

    HKEY_CURRENT_USER\Software\Bayes Filter Plugin\Algorithm hat Wert 1 in hexadezimal.

    Verstellt habe ich defintiv nichts. Dafuer hab ich gar keine Zeit mir all die Optionen anzuschauen und die Doku zu lesen, die Einstellungen hab ich alle so belassen!

    Registry Backup von den derzeitigen Einstellungen:


    Ich geh mal davon aus, du wolltest den jetzigen Stand der Registry und nicht, wenn's grad geloescht und neu angelegt wurde, oder hab ich dich da missverstanden?

    Vielleicht find ich morgen abend die Zeit dazu, den Kram zu loeschen und den Filter neu lernen zu lassen... jetzt fall ich ins Bett.

    Citizen, gute Besserung dem Mailserver und der Webpage wuenschend

  • Moin

    Habe vor ein paar Tagen endlich die Zeit gefunden, den Eintrag von Bayes Filter in der Registry zu loeschen und Bayes Filter selbst neu lernen zu lassen. Den neuen Eintrag in der Registry haeng ich unten an. Insgesamt sind die Filterergebnisse jetzt deutlich besser. Nur hin und wieder ist mal ne Mail dabei, die noch falsch aussortiert wird, aber das liegt wohl an der geringen Menge der bisher gelernten Ham und Spam Mails.
    Alles in allem: endlich scheint wieder alles in Ordnung zu sein :punk: :thumbup: und :thx: to Achim!