Bayes Regel

  • Hallo Zusammen,


    ich finde nirgendwo Informationen darüber, was die Kürzel bedeuten.
    Hat mir jemand eine Quelle?
    Was bedeutet:
    S:
    M:
    R:
    (V=0/P=100)


    Ich nutze TB 5.4.8
    Regula: 2.2.7.0

  • Wer lesen kann ist klar im Vorteil. :wacko:


    Die Kürzel R: S: M: hab ich in der Hilfe gefunden.

    Zitat

    Dabei steht "R:" für "Received:", "S:" für "Subject:" und "M:" für "X-Mailer:" bzw "User-Agent:".


    Es bleibt also nur noch
    (V=0/P=100)
    übrig.


    Hab noch was.
    Laut Statistik lernt Bayes bei mir immer noch.


    Ist die Bayes-Datenbank überhaupt noch effizient, oder soll ich Diese löschen und von vorne anfangen?
    Wie muss ich dann in den Regula-Einstellungen unter Reiter "Bayes" "automatisches Lernen" einstellen um dann nur noch über Rules.dat das Lernen zu steuern.
    In der Hilfe steht ja, dass man mit BayesAutoLearn nur die Funktion ein.- bzw. ausgeschaltet werden kann. Wie werden aber die 5 Lern-Möglichkeiten über die Rules.dat gesteuert.

  • Es bleibt also nur noch
    (V=0/P=100)
    übrig.

    Am besten direkt Gaijin anschreiben. Müsste etwas mit dem Score zu tun haben, da der Wert nicht über 100 geht.



    Ist die Bayes-Datenbank überhaupt noch effizient, oder soll ich Diese löschen und von vorne anfangen?

    Wenn die Filtereffizienz über 90 % liegt, dann ist alles OK. Fast kaum jemand hat 100 %. Entscheidend für das neue Training ist aber vielmehr, ob bei dir Nachrichten oft oder selten falsch klassifiziert werden.



    Wie muss ich dann in den Regula-Einstellungen unter Reiter "Bayes" "automatisches Lernen" einstellen um dann nur noch über Rules.dat das Lernen zu steuern. In der Hilfe steht ja, dass man mit BayesAutoLearn nur die Funktion ein.- bzw. ausgeschaltet werden kann. Wie werden aber die 5 Lern-Möglichkeiten über die Rules.dat gesteuert.

    So viel ich weiß, wird Rules.dat nur verwendet, wenn der einfache Modus (Reiter "Filterung") deaktiviert wurde; sonst nur EasyRules.dat. Mit den 5 Lern-Möglichkeiten meinst du wahrscheinlich die fünf Optionen unter "Automatisches Lernen" im Reiter "Bayes"? Diese, wie auch die übrigen Einstellungen aus dem Konfigurationsdialog, werden in Regula.ini gespeichert.

  • Am besten direkt Gaijin anschreiben. Müsste etwas mit dem Score zu tun haben, da der Wert nicht über 100 geht.


    Geht leider nicht, kann keine PN an ihn schreiben. Hab keinen Zugang zu seinem Profil. Kannst du bitte Gaijin, für mich, als Mod anschreiben?


    Wenn die Filtereffizienz über 90 % liegt, dann ist alles OK. Fast kaum jemand hat 100 %. Entscheidend für das neue Training ist aber vielmehr, ob bei dir Nachrichten oft oder selten falsch klassifiziert werden.


    Ja, ich habe viele falsch klassifiziert eMails. Weil diese Regel

    Code
    Match: Intern rule "ToAddrInAB" (TOADDR_IN_ADDRBOOK: Empfänger ist im address book)


    fälschlicherweise ständig zugeschlagen hat. Die Empfänger sind definitiv nicht im Adressbuch.
    Ich hab den Fehler nicht finden können und jetzt kurzerhand deaktiviert und jetzt funzt alles wieder wie es soll.


    Wäre es sinnvoll, die Bayes-Datenbank zu löschen??


    So viel ich weiß, wird Rules.dat nur verwendet, wenn der einfache Modus (Reiter "Filterung") deaktiviert wurde; sonst nur EasyRules.dat. Mit den 5 Lern-Möglichkeiten meinst du wahrscheinlich die fünf Optionen unter "Automatisches Lernen" im Reiter "Bayes"? Diese, wie auch die übrigen Einstellungen aus dem Konfigurationsdialog, werden in Regula.ini gespeichert.


    Richtig, ist bei mir deaktiviert und ich nutze Rules.dat.


    Meine letzte Frage war offensichtlich unklar von mir gestellt. :(


    In der Hilfe steht:


    Wie man die 5 Optionen in "Automatischen Lernen" in Reglua.dat steuert, ist in der Hilfe nichts zu finden. Daher die Frage danach.

  • Wäre es sinnvoll, die Bayes-Datenbank zu löschen??

    Wenn die Nachrichten jetzt richtig klassifiziert werden, dann wohl nicht. Sonst müsste man die Datenbank neu trainieren.



    Wie man die 5 Optionen in "Automatischen Lernen" in Reglua.dat steuert, ist in der Hilfe nichts zu finden. Daher die Frage danach.

    Die Frage habe ich schon verstanden. Ich dachte, dass aus meiner Antwort klar folgt, dass die Optionen aus dem Konfigurationsdialog ausschließlich über die Datei Regula.ini gesteuert werden (0 = deaktiviert | 1 = aktiviert). Ich nehme an, dass wenn man alle fünf Optionen deaktiviert, das automatische Lernen dabei ebenfalls deaktiviert wird, so dass man "BayesAutoLearn" nicht unbedingt braucht. Wie gesagt, am besten gleich beim Autor nachfragen. Die Kontaktmöglichkeit hat Gwen bereits genannt. Schreibe dann bitte kurz hier, was er geantwortet hat.

  • Die Bayesdatenbank soll nicht gelöscht werden.
    Wie soll denn das Plugin Spam erkennen, wenn die Datenbank der Spamworte samt Gewichtung weg ist? Die Datenbank ist notwendig.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Schau mal, schreib ihm per Mail. Adresse unter http://gaijin.at/teccontact.php


    Anfrage an @Gaijn ist raus.


    Die Bayesdatenbank soll nicht gelöscht werden.
    Wie soll denn das Plugin Spam erkennen, wenn die Datenbank der Spamworte samt Gewichtung weg ist? Die Datenbank ist notwendig.


    Ist klar. Datenbank muss dann wieder neu aufgebaut werden.


    Bis dahin vielen Dank an euch Beide für eure Hilfe.
    Jetzt heißt es warten auf Antwort vom Entwickler.

  • DNSBL/URIBL können bei zu vielen Abfragen blocken, Bayes verbessert jedenfalls die Filtergenauigkeit.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Man kann verschiedene BL-Server eintragen. Außerdem gibt es im Reiter "Filterung" andere Filterungsmöglichkeiten. Ich persönlich musste fast alle Absenderadressen in die weiße Liste eintragen, obwohl ich die Datenbank mit entsprechenden E-Mails trainiert habe, da Bayes trotzdem leider des Öfteren falsche Klassifizierungen verursachte. Bei einem Filter ist das aber nicht möglich, denn entweder ist die Filterbedingung erfüllt oder nicht.

  • DNSBL/URIBL können bei zu vielen Abfragen blocken, Bayes verbessert jedenfalls die Filtergenauigkeit.


    URLBL frage ich zwei ab und bei DNSBL sind es drei.


    Man kann verschiedene BL-Server eintragen. Außerdem gibt es im Reiter "Filterung" andere Filterungsmöglichkeiten. Ich persönlich musste fast alle Absenderadressen in die weiße Liste eintragen, obwohl ich die Datenbank mit entsprechenden E-Mails trainiert habe, da Bayes trotzdem leider des Öfteren falsche Klassifizierungen verursachte. Bei einem Filter ist das aber nicht möglich, denn entweder ist die Filterbedingung erfüllt oder nicht.


    Bei mir ist 'einfache Filterung' deaktiviert und alle Filter steuert nur die Rules.dat.
    Und da kommen zu aller erst meine selbst erstellten Filterregeln, um die Steu vom Weizen zu trennen und danach alle anderen Regeln und Die sind seit 2006 unverändert am Laufen und hab damit hab ich keinerlei Probleme.


    Die BL-Server sind unverändert. Hab jetzt keine Ahnung, ob die noch alle am Laufen sind und vor allem ob die noch up-to-date sind.

  • Ich hab jetzt mal Kontakt mit dem Entwickler von Regula (gaijin) aufgenommen.


    Hier die Zusammenfassung:


    Frage:
    In der Filter.log sind, wenn der Bayes-Filter aktiv ist, folgende Einträge zu finden:
    S:blabla (V=0/P=100)
    M:blub (V=8/P=84)
    R:IP oder Mail-Adresse (V=99/P=97)
    Antwort aus der Regula.chm:
    Dabei steht "R:" für "Received:", "S:" für "Subject:" und "M:" für "X-Mailer:" bzw "User-Agent:".
    Antwort des Entwicklers:
    Die Klammerwerte bedeuten (V=Value/P=Priority)


    Frage: Warum schlägt diese Regel zu, wenn der Empfänger definitiv nicht im Adressbuch enthalten ist.
    ,-----[Rules.dat ]-----
    | ToAddrInAB 0 IW "" [TOADDR_IN_ADDRBOOK: Empfänger ist im address book - aus Regel'Rules']
    `-------------------
    ,-----[Filter.log ]-----
    | Match: Intern rule "ToAddrInAB" (TOADDR_IN_ADDRBOOK: Empfänger ist im address book - aus Regel'Rules')
    `-------------------
    Antwort:
    Der Entwickler vermutet, dass die Empfängeradresse in einem Adressbuch eingetragen ist und
    er konnte bis jetzt keinerlei Probleme mit der Regel beobachten.


    Frage:
    Ist es sinnvoll die Bayes-Datenbank zu löschen und neu anlernen zu lassen.
    Antwort:
    Ab und zu kann es sicher nicht schaden. Vor allem auch, weil sich die Methoden der Spammer mit der Zeit ändern.
    Anmerkung von mir: Meine Bayes-Datenbank scheint mit den richtigen Worten gefüttert zu sein, denn die Trefferquote bei Bayes liegt bei mir rund bei 98,x%. Ich werde die db erst dann löschen und neu anlernen, wenn die Trefferquote unter 95% sinken würde, denn dann hätten die Spammer ihre Tricks geändert.