Regula markiert Mails trotz hohen Score als Ham!

  • Hallo,

    arbeite mit The Bat! Voyager 3.86 und Regula 2.2.4.

    Ich habe den einfachen Modus aktiviert. Geprüft wird nach Bayes-Methode, nach AutoWhiteList und nach ein paar einfachen Regeln (EasyRules.dat).

    Obwohl der Score über 100 liegt, werden die Emails als Ham markiert. In Voyager habe ich den "Score bei mehreren Plugins" als Mittelwert eingestellt, und in Junk-Ordner verschieben bei einem Score von 50.

    Hier ein Beispiel aus dem Regula-Manager:

    Subject: Best offers and prices.
    Sender: "after getting" <xyiskdewd@colinschaeffer.net>
    Date: Mon, 3 May 2004 20:49:16 -0400
    Msg-Id: <29AB00E018F8D12.8C456617CB@colinschaeffer.net>
    Bayes words:
    S:prices (V=100/P=100)
    0066ff (V=100/P=100)
    watches (V=100/P=100)
    offers (V=100/P=100)
    cc0000 (V=100/P=100)
    luxury (V=100/P=100)
    replicas (V=100/P=100)
    handbags (V=100/P=100)
    jewelry (V=100/P=100)
    price (V=97/P=94)
    prices (V=96/P=92)
    S:best (V=95/P=90)
    when (V=91/P=82)
    us-ascii (V=88/P=75)
    sans-serif (V=14/P=72)
    more (V=85/P=71)
    receive (V=85/P=70)
    center (V=16/P=68)
    align (V=17/P=67)
    arial (V=17/P=66)
    face (V=17/P=66)
    size (V=17/P=66)
    font (V=17/P=66)
    http (V=17/P=65)
    color (V=18/P=64)
    popular (V=82/P=63)
    total (V=19/P=62)
    style (V=22/P=57)
    name (V=23/P=55)
    href (V=24/P=51)
    Bayes result: 61% spam probability.
    Match: Intern rule "BayesScore" (EASYMODE_BAYES_FILTER), score: 61.
    URLBL-Check: by multi.surbl.org with domain "bankkffrrost.com" - LISTED. Time: 31 mSec.
    Match: Intern rule "URLBL" (EASYMODE_URLBL: multi.surbl.org), score: 100.
    Message marked as SPAM by last rule (score was 161).
    Bayes learned this mail as SPAM.
    Final score is: 100 (100), 2 rules matched >>> HAM.
    Message processed in 94 mSec.

    Wäre für Hilfe sehr dankbar, warum diese Email nicht als Spam markiert wird.
    Vor allem, warum das zum Schluss:
    Final score is: 100 (100), 2 rules matched >>> HAM.

    Müsste doch Spam sein, oder?

    Grüße,
    sombra

  • Die beiden Probleme haben denke ich nichts miteinander zu tun. Bei Gwendragon ist ja:
    Final score is: 95 (95), 1 rules matched >>> HAM.
    und das ist wohl richtig, da 95 kleiner als 100 ist.

    Bei sombra ist es so nicht nachzuvollziehen:
    Final score is: 100 (100), 2 rules matched >>> HAM.
    Finde ich in der Tat eigenartig.

    Du schreibst was von Mittelwert. Hast Du denn mehrere Plugins?
    Hast Du zusammenpassende Werte eingetragen in TheBat und Regula, was das Qualifizieren als Junk betrifft?
    :denk:

  • Ja, 3. Regula, Antispamsniper und BayesIt!. Die liefen auch über 1 Jahr lang zusammen ohne Probleme.

    Es hat alles angefangen, seitdem ich vor ca. 2 Tage die neueste Regula-Version installiert habe und dementsprechend die Einstellungen geändert habe.

    Meine Bayes-Database habe ich übernommen in Regula 2.4 und Regeln habe ich über die Homepage von Gaijn erstellen lassen.

    In The Bat! wie bereits erwähnt, bei einen Score von 50 in Junkordner verschieben. Bei Regula finde ich keine passende Option, die mit der von The Bat! harmoniert. Ich meine, eine Einstellung, wo ich wählen kann, ab wann eine Email als Junk zu markieren ist.

    Außerdem hat das wie Hendrik bemerkt hat, wenig mit EasyRules zu tuen.
    Jetzt nachdem ich es geändert habe:

    === BEGIN MESSAGE at 02.12.2006 01:43:56 ===
    Subject: hehe man, why your meat is so small?? :)
    Sender: "Ferguson Shane" <Campbell@outblaze.net>
    Date: Sat, 02 Dec 2006 00:35:30 +0000
    Msg-Id: <3c6d01c715a9$0f6721e4$1fdccd56@guen-oj7m2oowoo>
    Bayes words:
    boosting (V=100/P=100)
    enlarge (V=100/P=100)
    market (V=100/P=100)
    tested (V=100/P=100)
    analyzed (V=100/P=100)
    doctors (V=100/P=100)
    nine (V=100/P=100)
    month (V=100/P=100)
    figures (V=100/P=100)
    enough (V=100/P=100)
    said (V=100/P=100)
    shouldn't (V=100/P=100)
    what's (V=100/P=100)
    dying (V=100/P=100)
    wouldn't (V=100/P=100)
    better (V=99/P=98)
    works (V=98/P=96)
    money (V=98/P=96)
    months (V=97/P=94)
    S:your (V=97/P=94)
    house (V=97/P=93)
    dies (V=5/P=89)
    were (V=94/P=89)
    went (V=94/P=89)
    then (V=94/P=88)
    gold (V=94/P=87)
    order (V=93/P=86)
    much (V=92/P=84)
    when (V=91/P=83)
    same (V=91/P=83)
    Bayes result: 94% spam probability.
    Match: Intern rule "BayesScore" (EASYMODE_BAYES_FILTER), score: 94.
    URLBL-Check: by multi.surbl.org with domain "heaves.net" - LISTED. Time: 63 mSec.
    Match: Intern rule "URLBL" (EASYMODE_URLBL: multi.surbl.org), score: 100.
    Message marked as SPAM by last rule (score was 194).
    Bayes learned this mail as SPAM.
    Final score is: 100 (100), 2 rules matched >>> HAM.
    Message processed in 141 mSec.

    Zu beachten ist hier: Bayes learned this mail as SPAM. Trotzdem klassifiziert Regula die Email als HAM.

    Einmal editiert, zuletzt von sombra (2. Dezember 2006 um 01:50)

  • Die Zeile
    Final score is: 100 (100), 2 rules matched >>> HAM.
    ist wirklich drollig.

    Gaijin wüßte das natürlich jetzt genau, aber vielleicht liegt das daran, daß Du mehrere Plugins nutzt und auf "Mittelwert" gestellt hast.

    Entferne doch einfach mal probeweise die anderen. Oder stelle nicht auf "Mittelwert" sondern "Maximal". Dann reicht ja die Meinung eines Plugins, damit die Nachricht in den Junk-Ordner kommt.

    Ganz abgesehen davon, ist es überaus schwierig, daß alle der drei Plugins, die ja alle Bayes-Filterung nutzen, immer richtig klassifizieren. Persönlich halte ich es für sinnvoller, nur ein Plugin zu nutzen. Dann sieht man ja sofort, wenn ein Junk-Mail als HAM durchgeschlüpft ist, und man kann es umlernen (als Junk markieren).

  • Hallo,

    ich habe mein alter Regula-Ordner wiederhergestellt (Version 2.2) und in The Bat! kopiert. Dann habe ich den neuen Ordner damit komplett überschrieben. Jetzt habe ich den gleichen Zustand wie früher, um ein paar zusätzliche Regeln ergänzt. Und siehe da, es funktioniert alles wieder einwandfrei :yahoo:

    Hier ein Beispiel:

    -------------------------
    === BEGIN MESSAGE at 02.12.2006 11:36:02 ===
    Subject: change your size from S to XL
    Sender: "Nazarova Eric" <Davies@chek.com>
    Date: Sat, 2 Dec 2006 11:35:39 +0100
    Msg-Id: <205242475.20061202113539@caruni.de>
    Match: RegExp rule "Text" (TEXT_PRONOUNCE: Text is unpronouncable), score: 80.
    Match: Simple rule "PartCharset" (HEADER_CHARSET_US-ASCII: US-ASCII charset), score: 20.
    Match: Simple rule "Text" (TEXT_BAD_WORD: Approved), score: 50.
    Match: Simple rule "SubjText" (SUBJTEXT_BAD_WORD: Money), score: 60.
    Bayes words:
    S:change (V=100/P=100)
    boosting (V=100/P=100)
    enlarge (V=100/P=100)
    market (V=100/P=100)
    tested (V=100/P=100)
    analyzed (V=100/P=100)
    doctors (V=100/P=100)
    hundreds (V=100/P=100)
    started (V=100/P=100)
    master (V=100/P=100)
    copies (V=100/P=100)
    secret (V=100/P=100)
    outside (V=100/P=100)
    R:212.227.126.171 (V=0/P=100)
    better (V=99/P=98)
    words (V=99/P=97)
    down (V=98/P=97)
    S:your (V=98/P=96)
    R:mrelayeu.kundenserver.de (V=2/P=95)
    money (V=97/P=95)
    five (V=97/P=93)
    R:moutng.kundenserver.de (V=4/P=93)
    came (V=96/P=91)
    ones (V=94/P=89)
    life (V=94/P=88)
    order (V=93/P=86)
    pleased (V=92/P=84)
    when (V=92/P=83)
    sometimes (V=92/P=83)
    most (V=90/P=81)
    Bayes result: 87% spam probability.
    Match: Intern rule "BayesScore" (BAYES), score: 87.
    Match: Intern rule "IsScore" (SPAM_BEFORE_URLBL: Score is >= 100 - skipping URLBL queries), score: 0.
    Message marked as SPAM by last rule (score was 297).
    Bayes learned this mail as SPAM.
    Final score is: 100 (100), 6 rules matched >>> SPAM.
    Message processed in 109 mSec.

    :pfeif: :pfeif: :pfeif: :pfeif: