Ungereimtheiten 1.5.4

  • Hallo Achim!

    Ich denke, Du hast im Moment andere Sorgen als meine Rückmeldung. Trotzdem möchte ich Dir hier Feedback geben.

    Nachdem die Version 1.5.2 nie so gut gefiltert hatte, wie ich mir das gewünscht habe, habe ich reinen Tisch gemacht und Version 1.5.4 installiert.

    Meine Vorgehensweise:

      [li]Deinstallieren der alten Version: Zuerst das Plugin aus The Bat! entfernt, danach über die Systemsteuerung den BayesFilter deinstalliert.[/li][li]Löschen aller verbliebenen Dateien: Die Datenbanken, die Logdatei, etc. habe ich selbst gelöscht.[/li][li]Registry gesäubert: Bewußt nachgeschaut, daß in HKCU\Software kein BayesFilter-Eintrag mehr vorhanden ist.[/li][li]Installation 1.5.4: Installationsroutine durchgeklickt, allerdings einen abweichenden Pfad (C:\programme\internet\Bayes Filter Plugin) ausgewählt.[/li][li]Integration in The Bat!: Das Plugin in TB! eingetragen und "Configure" geklickt.[/li]

    Nicht schön: Obwohl ich dachte, ich hätte alle Einträge des alten Plugins gelöscht, zeigt mir die Statistik 410 Scanned Ham Mails und 59 Scanned Spam Mails an. :blink: Woher will der Filter denn das wissen? Die restlichen Werte standen auf 0.

    Ich werde weitertesten.

    Nachtrag: Nachdem ich genau 145 meiner Ham Mails als "NOT JUNK" markiert hatte (wurden *sauschnell* gescannt! Respekt! :thumbup: ), hat mir die Statistik folgendes angezeigt:
    21031072 Scanned Ham Mails
    20709784 Scanned Spam Mails
    Korrekt ist das nicht. :thumbdown: :denk:

    Nachtrag 2: Ich habe die Pfade zu den Datenbanken, Logfiles und *lists.txt in mein Daten-Verzeichnis auf ein andere Festplatte umgebogen, damit ich diese Daten von meiner System-Partition herunter habe. Nun war beim nächsten TB!-Start die Datenbank wie erwartet leer. Nachdem ich 1254 Spam-Mails und 955 Ham-Mails antrainiert habe, zeigt mir die Statistik folgendes:
    955 Scanned Ham Mails
    1235 Scanned Spam Mails
    :thumbup: Hmmm, das schaut jetzt mal gut aus. Bei den Spam-Mails waren wohl doppelte dabei, weshalb die Zahl leicht von meiner trainierten Zahl abweicht.

    Zufrieden bin ich mit der Erkennungsrate und der ausgegebenen Statistik der bisherigen Versionen nämlich nicht. :( Wenn ich eine garantiert eindeutige Mail (Debian Security List) als NOT JUNK markiere, erwarte ich, daß sich das in False Spam detected niederschlägt. Hat's aber bei 1.5.2 nicht getan.
    Nun warte ich mal ab, wie sich die 1.5.4 schlägt.

    Einmal editiert, zuletzt von CSe (17. September 2004 um 19:08)

  • hi,

    die werte über die scanned ham/spam mails stehen in der database.dat ziemlich am anfang. da muss wohl noch was übrig geblieben sein.

    das mit den komischen zahlen kann ich mir im moment auch nicht erklären. behalt das mal im auge! wenn sich die fehlerrate bei about nicht ändern sollte, so ist das ein hinweiss dafür, dass das plugin den pfad der tbplugin.ini datei nicht finden kann. das ist noch ein kleiner bug, da seit der the bat version 3.0 in den pfadangaben in der registry teilweise %APPDATA% verwendet wird. das interpretiert das plugin nicht und findet daher auch die datei nicht richtig. das werde ich ändern, sobald ich den harddiskcrash überstanden habe.

    im übrigen sind meinesourcen alle futsch. ich habe also nur noch was als download verfügbar war. das setupscript und das updatescript sind daher ebenfalls futsch. ich hoffe das ich das wieder rekonstruieren kann...

    achim