update von 1.4.2b ?

  • Moin

    Ich benutze seit langem BayesFilter in der Version 1.4.2b die inzwischen sicherlich schon gut veraltet ist... meine Frage: kann ich problemlos updaten oder sollte ich deinstallieren und ganz von vorn anfangen?
    Das von vorne anfangen waere sogar evtl. gut, da manchmal Mails nicht gefiltert werden, die an anderen Tagen gefiltert werden...
    Danke fuer die Antwort.

    Citizen

  • hi,

    bitte warte damit noch ein wenig, denn demnächst sollte ich eine bugfix version der 2.0.0 rausbringen können, die einige wichtige dinge korrigiert. leider wird sich das noch ein wenig hinziehen, da ich momentan ganz andere wichtigere probleme am hals habe.

    achim

  • Moin

    Sicher folge ich des Meisters Worten... :D
    Aber wenn das Update der 2.0.0 raus ist... kann ich dann die bestehende Version damit updaten oder sollte ich die deinstallieren und die neue installieren? Oder ist das noch nicht klar? Weiss ja nicht, wodran du noch arbeitest...

    Aber das wichtigste: Privatleben geht vor! Viel Erfolg!

    Citizen

    Einmal editiert, zuletzt von Citizen (29. Dezember 2004 um 12:26)

  • Moin

    Hmm... nunja, nun ist die 2.0.1 doch schon raus... aber ich bin immer noch nicht im klaren wie ich von meiner uralt 1.4.2b zur neuen Version kommen soll?
    Die neue Version einfach drueber hauen?
    Die alte Version loeschen und von vorn anfangen?
    Irgendein anderer Weg?
    Danke!

    Citizen

  • Moin

    Danke, hab ich vor ein paar Tagen gemacht und laeuft... nur zZ ein wenig uebereifrig, bisher 27 ham Mails als spam klassifiziert... ich lass ihn noch ein wenig mehr lernen (bisher mit 3400 ham und 4050 spam mails trainieren lassen) und werd mal whitelists einsetzen, wenn's nich besser wird...
    Danke jedenfalls fuer deine Hilfe. :)

    Citizen

  • schau mal im logfile nach was als reason bei diesen mails steht. wahrscheinlich sind das dns blacklists die dort zuschlagen. erhöhe einfach mal den dns count!!!

    achim

  • Moin

    Diese Wetter-Mail krieg ich zB jeden Tag, bisher immer als Spam erkannt, obwohl die Mail zum Grossteil immer recht identisch aufgebaut ist (halt ein Wetterbericht).

    Fr, Jan 14 2005, 07:47:14, SPAM RECEIVED, Message-ID: 20050114044213.D43EE21F040@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 14.01.05, Score: 100
    Fr, Jan 14 2005, 07:47:14, AUTOLEARNING SPAM, Message-ID: 20050114044213.D43EE21F040@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 14.01.05
    Fr, Jan 14 2005, 07:47:14, ADD SPAM, Message-ID: 20050114044213.D43EE21F040@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 14.01.05

    Hmm... ich seh da nix mit reason, hab mal verbose log angestellt, muss ich bis morgen warten bis wieder diese Wetter Mail kommt.

    Die DNS-Blacklist ist nicht aktiv, ich hab alles auf den default-Einstellungen gelassen.

    Citiizen

  • also das teil wird mit bayes aussortiert. schalte einfach mal die funktion " train on error" an und markiere diese mail als ham. danach sollte das problem nicht mehr auftauchen.

    achim

  • Moin

    'Train on Error' ist seit der Neuinstallation eingeschaltet, weil ich dieses Idee sehr gut finde... wirkt nur irgendwie leider nicht... :denk:
    Falscher Spam wird erst als Ham markiert (Meldung abwarten) und dann in den korrekten Ordner verschoben, so wie's sein soll...

    Citizen

  • Moin

    Heut ist diese Wetter-Mail nicht mehr als Spam erkannt worden:

    Sa, Jan 15 2005, 14:30:13, HAM RECEIVED, Message-ID: 20050115044128.631AB21F03B@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 15.01.05, Score: 0
    Sa, Jan 15 2005, 14:30:13, AUTOLEARNING HAM, Message-ID: 20050115044128.631AB21F03B@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 15.01.05
    Sa, Jan 15 2005, 14:30:13, ADD HAM, Message-ID: 20050115044128.631AB21F03B@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 15.01.05

    Naja, andere Mails (teilweise von mir selbst auf eine Mailingliste oder von anderen auf Mailinglisten) werden immer noch sehr haeufig als Spam erkannt... ein wenig zu eifrig der kleine... *g*

    Was mir beim durchsehen des logs auffaellt: ich hab nur eine als spam klassifizierte Mail gesehen, die einen score kleiner als 100 hatte, der Rest hat durchweg einen score von 100...

    Citizen

  • Zitat

    ich hab nur eine als spam klassifizierte Mail gesehen, die einen score kleiner als 100 hatte, der Rest hat durchweg einen score von 100...


    Achim hatte mal erklärt, dass eine Email meist entweder 0 bzw. 100 Punkte aufgrund des verwendeten Algorithmus' bekommt.

  • wenn das teil falsch sortiert kommt es auf das reason an. wenn es per bayes aussortiert wurde, dann hast du den filter falsch bzw. unzureichend trainiert.

    achim

  • Moin

    Und heute is die Wetter-Mail wieder aussortiert worden:

    Mo, Jan 17 2005, 20:42:57, SPAM RECEIVED, Message-ID: 20050117044248.5126621F694@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 17.01.05, Score: 100
    Mo, Jan 17 2005, 20:42:57, AUTOLEARNING SPAM, Message-ID: 20050117044248.5126621F694@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 17.01.05
    Mo, Jan 17 2005, 20:42:57, ADD SPAM, Message-ID: 20050117044248.5126621F694@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 17.01.05

    *seuftz* :(

    Wo kann ich denn die reason einsehen? verbose logging ist angeschaltet, nen unterschied zum normalen logging seh ich nicht...

    Generell werden zZ alle mails als spam aussortiert... Ich hatte eigetnlich reichlich zum trainieren ausgewaehlt, ham wie spam... naja, nochmal ein wenig mehr trainieren.

    Einziges Handicap: meine Grafikkarte ist seit gestern ziemlich hin, keine Ahnung wann ich wieder dazu komme, in Ruhe Mails zu lesen / im Web zu surfen.

    Citizen

  • hi,

    also irgendwie scheint da bei dir was nicht zu funktionieren. bei eingeschltetem verbose logging muessen mehr infos sichtbar werden als sie bei dir zu sehen sind. das passiert allerdings nur bei mails die mit eingeschaltetem verbose logging empfangen wurden. also einfach mal so einschalten und sofort dananch darauf hoffen das was anders aussieht geht natürlich nicht. wenn du es schaffst das verbose logging zu aktivieren sehe ich mehr. so kann ich nichts dazu sagen. ausserdem kannst du deine wetterfroschmail auf die whitelist setzen:

    TEXT: absender@wetter.de

    achim

  • Moin

    Wegen verbose logging: JETZT ist es wirklich an... keine Ahnung wieso der die Einstellung nicht uebernommen hat... vermutlich weil ich mal ein 'cancle' statt ein 'ok' erwischt hab oder so... :rolleyes:

    Heute ist die Wettermail mit nem score von 0 nicht als spam erkannt worden, mal die naechsten Tage abwarten.

    Ich nehm die Wettermail nur als Beispiel... ich hab heut morgen knapp 30 Mails abgeholt, wovon die Haelfte ham war und bis auf die Wettermail sind alle als spam aussortiert worden... ich wollte eigentlich nicht jede einzelne Adresse (wie wetter.de) in die whitelist setzen...

    Ich gruebele zZ ob's sinnvoll waere, die bisherige Datenbank zu killen und nochmal neu anzulegen... aber damit warte ich erstmal noch ein paar Tage...

    Citizen

  • also wie das aussieht macht das keinen sinn mehr. bitte lösch die datenbank und trainiere sie neu. wenn dann mails falsch sortiert werden, so schick mir doch bitte mal den entsprechenden logfileauszug per mail zu.

    achim

  • Moin

    Sorry, aber ich hab die Datenbank noch nicht geloescht weil mich dich interessierte ob nochmal die Wetter-Mail als Spam raussortiert wird, und siehe da, heute war's wieder soweit, incl verbose logging angeschaltet:

    Word Database loaded...
    Undo Database loaded...
    Blacklist loaded...
    The Blacklist is empty.
    Whitelist loaded...
    The Whitelist is empty.
    Sa, Jan 22 2005, 15:12:15, SPAM RECEIVED, Message-ID: 20050122044100.155F321F686@mail.wetternet.de, From: noreply@wetter.net, Subject: WetterMail vom 22.01.05, Score: 85
    grauen | 1 | 1 | 6 | 0.99944771 | 0.00144998
    sorgen | 1 | 6 | 13 | 0.99847207 | 0.00314161
    80% | 3 | 46 | 15 | 0.98993453 | 0.00362494
    H*127.0.0.1 | 1 | 204695 | 24 | 0.03415471 | 58.3675506
    aktuelles | 1 | 13447 | 5 | 0.10083743 | 3.83433134
    Urlaub | 1 | 24365 | 11 | 0.11984609 | 6.94753350
    Aussichten | 1 | 13084 | 6 | 0.12150373 | 3.73082407
    Damen | 1 | 13872 | 7 | 0.13209071 | 3.95551754
    bei | 2 | 82870 | 1233 | 0.81776774 | 0.29797003
    50% | 3 | 26173 | 20 | 0.18730278 | 7.46307385
    hierzu | 2 | 13889 | 11 | 0.19281247 | 3.96036498
    Ihr | 1 | 33690 | 455 | 0.80289071 | 0.10995650
    bestimmt | 1 | 13465 | 11 | 0.19768372 | 3.83946393
    länger | 2 | 13865 | 12 | 0.20700120 | 3.95352153
    präsentiert | 1 | 12672 | 11 | 0.20748775 | 3.61334474
    wieder | 1 | 86292 | 86 | 0.23111506 | 24.6056458
    Tage | 1 | 23558 | 27 | 0.25687691 | 6.71742230
    können | 2 | 25461 | 242 | 0.74138005 | 0.05848236
    Mit | 1 | 40824 | 347 | 0.71938611 | 0.08385694
    Bitte | 2 | 47408 | 394 | 0.71482278 | 0.09521508
    Ihnen | 1 | 24677 | 204 | 0.71373878 | 0.04929918
    Für | 1 | 42475 | 61 | 0.30223492 | 12.1114913
    http | 7 | 241527 | 1605 | 0.66713639 | 0.38786854
    Wenn | 2 | 17883 | 111 | 0.65181880 | 0.02682455
    beträgt | 1 | 4446 | 8 | 0.35178566 | 1.26775021
    gilt | 1 | 19113 | 35 | 0.35579627 | 5.44995723
    22.01.2005 | 1 | 0 | 0 | 0.40000000 | 0.00000000
    temperatur | 1 | 0 | 0 | 0.40000000 | 0.00000000
    hwach | 1 | 0 | 0 | 0.40000000 | 0.00000000
    möchten | 2 | 31093 | 72 | 0.41121312 | 8.86598232
    unter | 4 | 127412 | 300 | 0.41525586 | 36.3307670
    Min | 3 | 13020 | 34 | 0.44059141 | 3.71257485
    dem | 1 | 75269 | 316 | 0.55873699 | 0.07636539
    folgenden | 1 | 13143 | 54 | 0.55341012 | 0.01304978
    ISO-8859-1 | 1 | 256211 | 688 | 0.44748228 | 73.0570288
    Weitere | 1 | 16630 | 46 | 0.45482280 | 4.74194468
    Last | 1 | 12671 | 37 | 0.46828412 | 3.61305960
    Tipp | 1 | 12677 | 44 | 0.51143906 | 0.01063316
    der | 2 | 145265 | 477 | 0.49758021 | 41.4214428


    Ich hab aber nur diesen einen Eintrag gefunden, hab das log extra zweimal langsam durchgeschaut.

    Sieht fast so aus, als ob ich mal ham als spam klassifiert habe und der nun die 'guten' worte als spam ansieht... aber eigentlich hab ich immer aufgepasst, dass ich das richtige von beiden erwische...

    Citizen