BayesIt - RegEx Filter Notation

  • Die RegEx Filter Notation funktioniert bei mir grundsätzlich nicht.
    Hab's explizit in einer Serie von Emails via Testaccount getestet.
    Viagra wird nur erkannt wenn als Signalwort
    viagra im Blacklist Regeleditor steht - nicht wenn
    ich z.B. schreibe v[i1l]agra!

    Als Beweis für eine erfolgreiche "Ausfilterung" habe ich jeweils den
    Eintrag im Log: "Treffer auf der Blacklist: Viagra-" gewertet.
    Und das Landen des Mails im SPAM-Ordner.

    Die Datei pcre.dll ist im BayesIt-Verzeichnis vorhanden. Muss sie
    vielleicht in der WinReg registriert werden?

    Ich verwende BayesIt 0.7.4. + TheBat 2.12 + Windows 2000.
    Das Problem war aber bei der 0.7.3 auch schon.

    Hat jemand eine Idee wo das Problem liegen könnte?

    Der Tabreiter "Ausnahmen" im Regeleditor hat welche Funktion? Black
    and White ist selbstsprechend formuliert. Aber ich kann mir kein
    praktisches Beispiel für "Ausnahmen" vorstellen.

    Für Hinweise wäre ich sehr dankbar.

  • Zitat

    Die RegEx Filter Notation funktioniert bei mir grundsätzlich nicht.


    Überprüfe mal, ob auch wirklich alle möglichen Schreibweisen im regulären Ausdruck erfasst sind. Der Ausdruck im Tutorial ist nur als einfaches Beispiel zu verstehen und muss gegebenenfalls noch erweitert werden. Beachte bitte auch, dass die eckigen Klammern zum RegEx-Ausdruck und nicht zum Suchbegriff gehören. Ebenso wird wohl kein Spammer den Buchstaben "i" mehrmals verschlüsseln, wie in deinem Beispiel "i1l" geschrieben.
    Kurz gesagt, dein Regulärer Ausdruck ist wahrscheinlich syntaktisch falsch.

    Zur weitergehenden Einarbeitung in das Thema RegEx empfehle ich den RegEx-Kurs http://www.regenechsen.de/regex_de/regex_1_de.html

    Zitat

    Die Datei pcre.dll ist im BayesIt-Verzeichnis vorhanden. Muss sie
    vielleicht in der WinReg registriert werden?

    Nein, das ist nicht notwendig. Wie im Tutorial beschrieben erkennt BayesIt die pcre.dll aber nur, wenn sie im gleichen Ordner wie "thebat.exe" liegt.
    Ob sie korrekt geladen wurde, erkennt man im RegEx-Debugger. Der korrekte Status wird in der obersten Zeile ausgegeben.

    Zitat

    Der Tabreiter "Ausnahmen" im Regeleditor hat welche Funktion?


    Man stelle sich vor, man erhält Mails, auf die gar keine Filterfunktionen angewandt werden sollen. BayesIt fügt zwar keine zusätzlichen Header oder andere Erkennungsmerkmale in die ausgewerteten E-Mails ein aber manchmal ist es doch wünschenswert, wenn E-Mails von bestimmmten Absendern oder mit bestimmten Betreffzeilen überhaupt nicht ausgewertet werden, z.B. weil Teile ihres Inhalts dann in der Log-Datei als Klassifizierungsteile auftauchen.

    Stefan Starke

    Einmal editiert, zuletzt von Stefan Starke (17. November 2004 um 19:45)