Sorry, paar Fragen

  • Hallo,
    ich versuche mich langsam mit dem Regula-Plugin vertraut zu machen, finde aber zu manchen Dingen weder in der Hilfe oder im Forum Infos dazu.
    Vermutlich sind es ganz einfache Dinge, aber ich komme da nicht weiter.

    1) Werden alle regeln im "Rules" Ordner durchgearbeitet, wenn ja, in welcher Reihenfolge. Oder kann ich einstellen, welche .dat Datei verwendet werden soll?

    2.) Wie kann ich URLBL-Server eintragen, finde weder in TheBat noch im RegulaMgr eine entsprechende Funktion. Auch in keiner *.dat Datei finde ich einen EIntrag mit "URLBL". Muß ich mir eine extra Rule schreiben für solche abfragen?

    3.) Wenn ich mir eine einfach Regel selbst erstellen will für folgenden (einfachen) Zweck (zum verstehen des Syntaxes z.B.), wie müßte die Rule-Datei aussehen? :
    Wenn im Betreff "SuPer-MarTin" vorkommt, nie als Spam deklarieren, andere Rules/URLBL-Abfragen sind nicht mehr nötig (also Ham und fertig)
    (3b PS: Wo finde ich Infos zu dem Syntax einer Rule-Date? Was bedeutet ein "S" oder ein "R" oder ein "SH"? Die Zahl davor ist wohl der Score. Aber was ist der cyptische Name (RcvFrom), was der text in den eckigen Klammern ([RECEIVED_SERVER: Hotmail] ?

    4.) Welche der mitgelieferten Rules sind denn ohne Änderungen direkt sinnvoll einsetzbar?
    Wie kann ich die Bayes-DB mir "anschauen" um zu sehen, was er bislang gelernt hat und welche Wörter für Bayes als Spam-Hinweis dienen?

    5.) Wie deute ich folgendes Logfile, es handelt sich eigentlich nicht um Spam. Hat Bayes ja eigentlich auch relativ korrekt erkannt. Aber was bedeutet dann:
    Match: Internal rule IsScore, SPAM_BEFORE_URLBL: Der Score ist >= 100 - keine URLBL-Abfragen, Score: 0. => Message marked as SPAM by last rule.
    ?

    Sorry für die vielen fragen ...
    VG & Danke,
    Martin
    --------------
    Match: Internal rule HdrExist, SUBJECT_RE_WO_REPLYREF: "Re" im Betreff, aber keine Antwort, Score: 90.
    Bayes word results:
    wieder (S=29 / H=7, C=1): 0,66.
    zwischen (S=8 / H=0, C=1): 1,00.
    noch (S=101 / H=6, C=1): 0,89.
    haben (S=65 / H=19, C=2): 0,62.
    einem (S=21 / H=6, C=1): 0,62.
    ihnen (S=69 / H=17, C=1): 0,66.
    einer (S=20 / H=2, C=1): 0,83.
    drei (S=5 / H=0, C=1): 1,00.
    oder (S=107 / H=28, C=1): 0,64.
    wochen (S=5 / H=4, C=1): 0,37.
    keine (S=40 / H=67, C=1): 0,22.
    wenn (S=62 / H=82, C=1): 0,26.
    sehr (S=20 / H=7, C=2): 0,57.
    geehrte (S=6 / H=0, C=1): 1,00.
    finden (S=66 / H=18, C=1): 0,63.
    freuen (S=15 / H=0, C=2): 1,00.
    sollten (S=45 / H=15, C=1): 0,59.
    unsere (S=38 / H=11, C=1): 0,62.
    interesse (S=6 / H=3, C=1): 0,49.
    frau (S=11 / H=2, C=1): 0,72.
    freundlichen (S=7 / H=6, C=1): 0,36.
    mades (S=13 / H=3, C=1): 0,67.
    zeit (S=7 / H=2, C=1): 0,62.
    grüßen (S=3 / H=2, C=1): 0,41.
    Bayes result: 64.38% spam probability.
    Match: Internal rule BayesScore, BAYES, Score: 28.
    Match: Internal rule IsScore, SPAM_BEFORE_URLBL: Der Score ist >= 100 - keine URLBL-Abfragen, Score: 0.
    Message marked as SPAM by last rule.
    Bayes learned this mail as SPAM.
    Finished: 17.11.2005 20:22:13.
    Processed in 249 mSec, total score: 100, rules matched: 3.

    Einmal editiert, zuletzt von Topsurfer (17. November 2005 um 22:04)

  • Zitat

    finde aber zu manchen Dingen weder in der Hilfe oder im Forum Infos dazu.

    Also ich finde zu jeder deiner Fragen die Antworten darauf in der Hilfe...
    Ohne die Hilfe gelesen zu haben, wirst du dich nicht auskennen und schon gar nicht mit dem Plugin arbeiten können.

    Zitat

    1) Werden alle regeln im "Rules" Ordner durchgearbeitet, wenn ja, in welcher Reihenfolge. Oder kann ich einstellen, welche .dat Datei verwendet werden soll?

    In der Hilfe:
    Regeldateien --> Die Regeldatei "Rules.dat"
    bzw.
    Regeldateien --> Einbinden von anderen Regeldateien

    Zitat

    2.) Wie kann ich URLBL-Server eintragen, finde weder in TheBat noch im RegulaMgr eine entsprechende Funktion. Auch in keiner *.dat Datei finde ich einen EIntrag mit "URLBL".

    Siehe Datei "Rules.dat", ab Zeile 56.

    Zitat

    3.) Wenn ich mir eine einfach Regel selbst erstellen will für folgenden (einfachen) Zweck (zum verstehen des Syntaxes z.B.), wie müßte die Rule-Datei aussehen? :
    Wenn im Betreff "SuPer-MarTin" vorkommt, nie als Spam deklarieren, andere Rules/URLBL-Abfragen sind nicht mehr nötig (also Ham und fertig)
    (3b PS: Wo finde ich Infos zu dem Syntax einer Rule-Date?

    Zu finden in der Hilfe unter "Regeln erstellen", inklusive aller Untereinträge.

    Zitat

    Was bedeutet ein "S" oder ein "R" oder ein "SH"? Die Zahl davor ist wohl der Score. Aber was ist der cyptische Name (RcvFrom), was der text in den eckigen Klammern ([RECEIVED_SERVER: Hotmail] ?

    Das steht auch in der Hilfe (Regeln erstellen --> Regel-Format).

    Zitat

    4.) Welche der mitgelieferten Rules sind denn ohne Änderungen direkt sinnvoll einsetzbar?

    Das musst du selbst rausbekommen, es sei denn, du bekommst die selben Spam-Mails wie ich...

    Zitat

    Wie kann ich die Bayes-DB mir "anschauen" um zu sehen, was er bislang gelernt hat und welche Wörter für Bayes als Spam-Hinweis dienen?

    Regula Manager starten --> Statistik --> Übersicht.
    In der Hilfe unter "Installation und Konfiguration --> Regula Manager" zu finden.

    Zitat

    Hat Bayes ja eigentlich auch relativ korrekt erkannt.

    Wieso? Zu 64.38% Spam...

    Zitat

    Aber was bedeutet dann:
    Match: Internal rule IsScore, SPAM_BEFORE_URLBL: Der Score ist >= 100 - keine URLBL-Abfragen, Score: 0. => Message marked as SPAM by last rule.
    ?

    Die obige Regel besagt, dass der Score größer oder gleich 100 war und darum die (langsamen) URLBL-Anfragen nicht ausgeführt werden.
    Der Grund dafür war, dass ein "Re:" im Betreff war, aber keine References-Zeile im Header.

  • Zitat

    Das is aber ne fiese Regel :D
    War es nicht so, dass Outlook keine References anlegt?


    Outlook trägt keinen References-Header ein, aber einen In-Reply-To-Header und dieser wird von der Regel ebenfalls umfasst.

    Code
    & Subj      0 R "^(Re|AW)(\[\d+\])?\:"
    & HdrExist  0 IN "In-Reply-To"
       HdrExist 90 IN "References" [SUBJECT_RE_WO_REPLYREF: "Re" im Betreff, aber keine Antwort]
  • Upps,
    sorry, da hab eich die Hilfe wohl wirklcih falsch gelesen.
    Danke für die ausführlichen Infos und Erklärungen !!

    Bei den Rules aber z.B. habe ich nur im "Rules" Ordner nach dem Text "URLBL" gesucht und nichts gefunden, daher war mir da z.B. unklar, wo die URLBL's eingepfegt sind. Sind eben in der Rules.dat, ein Verzeichniss weiter oben ....

    Aber noch eine Verständnisfrage:
    Ich habe normale TheBat installiert, danach Regula. Welcher Bayes-Filter (Logic) wird verwendet? Regula ist ja "nur" auf Regeln aufgebaut. Irgend ein Bayes-filter ist bei mir ja aber aktiv, das Logfile zeigt ja auch eine Bayes-Spam-Wahrscheinlichkeit an.
    Sollte ich besser noch einen anderen (besseren) Bayes-Filter installieren?
    Kann ich einfach einen anderen Bayes-Spam-Filter installieren (K9 z.B). So das , wenn K9 eine Spam-Wahrscheinlichkeit von <80% ermittelt, noch "meine" angepassten regula-Filter geprüft werden.

    Danke,
    Martin

  • Zitat

    Welcher Bayes-Filter (Logic) wird verwendet? Regula ist ja "nur" auf Regeln aufgebaut. Irgend ein Bayes-filter ist bei mir ja aber aktiv, das Logfile zeigt ja auch eine Bayes-Spam-Wahrscheinlichkeit an.


    Was meinst du mit "welcher Bayes-Filter"? Wenn du nur Regula installiert hast, wird es wohl der vom Regula Plugin sein, vor allem dann, wenn er im Regula-Log steht.

    Zitat

    Sollte ich besser noch einen anderen (besseren) Bayes-Filter installieren?


    Das Plugin ist definitiv für Anfänger überdimensioniert. Wenn du dich intensiver mit Spam-Filterung beschäftigen möchtest - gut, aber ansonsten wäre K9 sicher eine gute Alternative.