zu viel unerkannter Spam in letzter Zeit

  • Hallo!

    War eigentlich mit dem Plugin bisher ganz zufrieden, aber in letzter Zeit
    (ca. 2-3 Wochen) ist die Erkennungsrate von SPAM-Mails rapide gesunken.
    Woran kann das liegen?
    Offiziell sagt mir das Plugin, das die Quote nur bei 52% liegt...was wohl ein
    wirklich schlechter Wert ist. :thumbdown:
    Hat jemand ähnliche Beoabchtungen gemacht?

    Habe jetzt heute mal die neue 1.4.2beta eingespielt...mal schauen ob das
    was verändert.

    TIA
    Grüsse
    Watson

  • Hmmm, ich hab BayesFilter erst seit gestern im Einsatz, erhalte aber massiv SPAM und der wird sauber entfernt. :denk:

    Da ich aber eben erst seit gestern umgestiegen bin, kann vielleicht jemand anders eine bessere Referenz bieten. Mein Filter wurde mit 7'500 SPAM's trainiert (hatte BayesFilter mal probeweise vor ein paar Monaten neben BayesIT laufen, von daher schon 3'000 und 4'500 habe ich hier noch als SPAM Packs von mir selber archiviert).

  • hallo,

    schau doch mal in das logfile und schalte verbose logging an. daran sieht man dann weshalb die mails wo einsortiert werden. ich tippe darauf, dass du irgendwas in der whitelist aufgenomen hast das vielleicht dazu beiträgt, dass viele spams falsch erkannt werden. du koenntest mal die whitelist löschen und das autoinsert whitelist abschalten. vielleicht ändert sich dann was.

    achim

  • Hi Achim,

    danke für die schnelle Antwort.
    Also Auto-Insert für die White-List war und ist abgeschaltet.
    Habe mir mal die Log-Datei angeschaut und exemplarisch einen
    Datensatz herausgesucht. Ist das nicht eindeutig Spam??
    (hoffe der Ausschnitt ist aussagekräftig genug!)

    Sollte ich evt. die Datenbank nochmal resetten und Spam und Ham
    neu trainieren??

    Danke im voraus.
    CU


    Hier der Ausschnitt:

    Sa, Jul 24 2004, 13:12:30, HAM RECEIVED, Message-ID: CJhvjepBfjdinbooAhnyBofu@195.178.163.161, From: "D. Harris" <Drake@we-help-u.biz>, Subject: These points on homes won't last forever, Score: 0
    H*mx0.mail.net | 1 | 410 | 114 | 0.14448669 | 0.75785582
    H*213.165.64.100 | 1 | 410 | 164 | 0.19547080 | 0.75785582
    H*delta.mc1.sevrer.de | 1 | 16 | 12 | 0.23109782 | 0.02957486
    H*80.237.128.251 | 1 | 16 | 12 | 0.23109782 | 0.02957486
    H*mx0.mail.de | 1 | 29 | 24 | 0.24905052 | 0.05360444
    H*195.178.163.161 | 1 | 0 | 0 | 0.40000000 | 0.00000000
    H*we-help-u.biz | 1 | 0 | 0 | 0.40000000 | 0.00000000
    F*we-help-u.biz | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*LEGIONNAIRE | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*REMAINDER | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*Bfjdinboo | 1 | 0 | 0 | 0.40000000 | 0.00000000
    S*forever | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*CJhvjep | 1 | 0 | 0 | 0.40000000 | 0.00000000
    S*points | 1 | 0 | 0 | 0.40000000 | 0.00000000
    F*Harris | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*HELIUM | 1 | 0 | 0 | 0.40000000 | 0.00000000
    S*These | 1 | 0 | 0 | 0.40000000 | 0.00000000
    S*homes | 1 | 0 | 0 | 0.40000000 | 0.00000000
    S*won't | 1 | 0 | 0 | 0.40000000 | 0.00000000
    F*Drake | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*Ahny | 1 | 0 | 0 | 0.40000000 | 0.00000000
    M*Bofu | 1 | 0 | 0 | 0.40000000 | 0.00000000

    Sa, Jul 24 2004, 13:12:30, AUTOLEARNING HAM, Message-ID: CJhvjepBfjdinbooAhnyBofu@195.178.163.161, From: "D. Harris" <Drake@we-help-u.biz>, Subject: These points on homes won't last forever
    Sa, Jul 24 2004, 13:12:30, ADD HAM, Message-ID: CJhvjepBfjdinbooAhnyBofu@195.178.163.161, From: "D. Harris" <Drake@we-help-u.biz>, Subject: These points on homes won't last forever

  • hi,

    der hier gezeigte ausschnitt ist eindeutig ham! insbesondere die ersten 5 wörter tasuchen in deiner datenbank öfter in ham als in spam mails auf. die wörter darunter sind bisher noch nie in deiner datenbank aufgetaucht...

    achim

  • hi,

    aha....wie bekomme ich das Problem nun in den Griff?
    Sollte ich einfach nochmal neu trainieren um wieder
    eine SPAM-freie Mailbox zu bekommen?

    Danke + Grüsse
    Watson

  • hi,

    du solltest einfach mal mehr spam mails nachtrainieren. was du bisher trainiert hast war einfach zu wenig. spam datenbanken zum trainieren gibts verschiedene. auf batworld z.b....

    achim