Regula Plugin 1.1.7

  • Zitat

    Ok, ich hatte angenommen, dass das Plugin - wie die anderen - über The Bat (Als Spam / Nicht-Spam markieren) angelernt wird.
    Auch das wird m.E. nirgendwo so ganz deutlich erwähnt.
    Vielleicht hab ich auch nur Tomaten auf den Augen. ;)


    Sagts nich schon der Name des Plugins? Plugins die aus Wörtern lernen haben irgendwas mit Bayes zu tun...

  • Zitat

    Hm, genau da scheint mir die Anleitung aber nicht tief genug zu gehen.
    Die grundsätzliche Installation ist ja kaum beschrieben.


    Was könnte beim Punkt "Installtion" noch hinzugenommen werden?
    Ich weiß nicht, wo es hier Unklarheiten geben könnte.

    Zitat

    Ok, ich hatte angenommen, dass das Plugin - wie die anderen - über The Bat (Als Spam / Nicht-Spam markieren) angelernt wird.
    Auch das wird m.E. nirgendwo so ganz deutlich erwähnt.


    Nur Bayes-Filter können angelernt werden. Bei einem Regel-Filter ist dies nicht möglich.
    Ich werde versuchen, die Anleitung dahingehend zu erweitern, aber grundsätzlich gilt: Alles was nicht beschrieben ist, kann das Plugin nicht.

  • Hallo Gaijin,

    sind eigentlich noch Erweiterungen/neue Techniken beim Regula Plugin geplant? Ansonsten ist die Spamerkennung aber schon jetzt sehr gut. :thumbup:
    Ich hatte nur vor einiger Zeit einen Totalausfall vom Regula Plugin und jeglicher Spam kam durch. Allerdings war es einmalig und ließ sich nicht reproduzieren.


    Gruß,
    Zocko

    Einmal editiert, zuletzt von Zocko (20. April 2005 um 19:47)

  • Hallo Zocko!

    Zitat

    sind eigentlich noch Erweiterungen/neue Techniken beim Regula Plugin geplant?


    Geplant ist egentlich nichts, mir fällt auch nicht wirklich was sinnvolles ein.
    Aber wenn du Vorschläge hättest...

    Zitat

    Ich hatte nur vor einiger Zeit einen Totalausfall vom Regula Plugin und jeglicher Spam kam durch. Allerdings war es einmalig und ließ sich nicht reproduzieren.


    Das hatte ich bis jetzt noch nicht.
    Normalerweise würde ich sagen, entweder geht's oder es geht nicht - aber wer weiß, was daran schuld war... :blink:

  • Zitat


    Sagts nich schon der Name des Plugins? Plugins die aus Wörtern lernen haben irgendwas mit Bayes zu tun...


    Was sagt denn "Regula Plugin" über Bayes?? :bye:

    Außerdem wollte ich damit verdeutlichen, dass ich von einer einfachen Bedienung ausgegangen bin, während Gaijin meinte, dass man RegExp können müsste. :blink:

    ~Alex

  • Zitat

    Was könnte beim Punkt "Installtion" noch hinzugenommen werden?
    Ich weiß nicht, wo es hier Unklarheiten geben könnte.

    Also im Kapitel "Installation und Einstellungen" steht zum einen, wie die dpcre.dll installiert wird (erster Absatz).
    Der zweite Absatz fängt dann so an:

    Zitat

    Nach dem Einbinden des Plugins in The Bat! wird der Einstellungsdialog des Plugins automatisch angezeigt.

    Äh...
    Naja, ne Installationsbeschreibung stelle ich mir anders vor. ;)

    Klar, es ist ein Plugin, also kann man es wohl hinkopieren, wohin man möchte.
    Oder nicht?
    Hätte ich vorher noch nie ein Plugin installiert, hätte ich in jedem Fall raten müssen.

    Für etwas unbedarftere/unerfahrenere Mitmenschen wäre ein kleiner Absatz wie

    Zitat

    Den Inhalt des Regula-Archivs in ein beliebiges Verzeichnis (z.B. Unterhalb der TheBat-Installation) kopieren.
    Das Plugin wird dann eingebunden, indem man dieses in The Bat unter Optionen / Benutzereinstellungen / Plugins hinzufügt. Dazu muss zu dem oben ausgewählten Verzeichnis navigiert und regula.tbp ausgewählt werden.

    Noch besser wäre latürnich ein Setup, wie es BayesFilter bietet... ;)

    Oder ist eine so detaillierte Beschreibung zu uncool? :D

    Ich war jedenfalls etwas verwirrt, weil bei mir ja gar nix ging und ich das beschriebene Verhalten hatte.
    Werde es evtl. nochmal hier zuhause mit dem 3er-Bat probieren.

    ~Alex

  • Zitat

    Werde es evtl. nochmal hier zuhause mit dem 3er-Bat probieren.

    Da schau mal einer guck!
    Hab's zuhause mit der 3er-Version ausprobiert und es sieht jetzt etwas besser aus.
    The Bat lässt sich Beenden und Neustarten ohne, dass das Plugin verschwindet.

    Allerdings dasselbe Problem beim Anlernen von Ham für die Auto-Whitelist.
    Nach vier Einträge streckt er die Segel und meldet "Beim Hinzufügen zur Auto-Whitelist ist ein Fehler aufgetreten".
    Hm, probiert man es mehrmals, kann man auch weitere Einträge hinzufügen. Ist aber nicht wirklich deterministisch. :(
    Und nein, es gibt keine Probleme mit den Zugriffsberechtigungen - offensichtlich, denn etwas kommt ja rein.

    ~Alex

  • Zitat

    Oder ist eine so detaillierte Beschreibung zu uncool?

    Schätze mal eine gewisse Grundkenntnis wurde einfach vorrausgesetzt.

  • Zitat

    Äh...
    Naja, ne Installationsbeschreibung stelle ich mir anders vor. ;)


    Ich nicht. Wie man ein Plugin einbindet setze ich voraus.

    Zitat

    Klar, es ist ein Plugin, also kann man es wohl hinkopieren, wohin man möchte.
    Oder nicht?


    Natürlich, da der Plugin-Pfad (automatisch bzw. manuell) angegeben wird ist das kein Problem.

    Zitat

    Für etwas unbedarftere/unerfahrenere Mitmenschen...


    ...ist das Regula Plugin nicht gedacht und darum auch nicht darauf ausgelegt.

    Zitat

    Oder ist eine so detaillierte Beschreibung zu uncool?


    "Zu uncool"?!? :blink:
    Nein.

    Zitat

    Allerdings dasselbe Problem beim Anlernen von Ham für die Auto-Whitelist.
    Nach vier Einträge streckt er die Segel und meldet "Beim Hinzufügen zur Auto-Whitelist ist ein Fehler aufgetreten".


    Man kann das Regula Plugin nicht "anlernen".
    Nach 20 Einträgen in die Datei durch wahllose Markierung als "Nicht-Spam" sowie bei der Markierung von über 100 Mails war kein Fehler zu sehen. Obgleich diese Funktion nur zum Markieren von einzelnen Absendern gedacht ist und auch nur so verwendet werden sollte.

    Zitat

    Nach vier Einträge streckt er die Segel und meldet "Beim Hinzufügen zur Auto-Whitelist ist ein Fehler aufgetreten".
    Hm, probiert man es mehrmals, kann man auch weitere Einträge hinzufügen. Ist aber nicht wirklich deterministisch.
    Und nein, es gibt keine Probleme mit den Zugriffsberechtigungen - offensichtlich, denn etwas kommt ja rein.


    Kannst du den Vorgang mal im Detail beschreiben, damit ich den Fehler nachvollziehen kann?

  • Zitat

    Geplant ist egentlich nichts, mir fällt auch nicht wirklich was sinnvolles ein.


    Was ist eigentlich aus den nicht ganz so aggresiven Regeln geworden die mal jemand ausgearbeitet hatte? :rolleyes:

    Zitat


    Das hatte ich bis jetzt noch nicht.
    Normalerweise würde ich sagen, entweder geht's oder es geht nicht - aber wer weiß, was daran schuld war... :blink:


    Hatte gerade eben gleiches Problem?! Regula scheint gestartet zu sein (Regula: 248 rules loaded totally. Give me Spam!), aber keine einzige Nachricht wurde gefiltert. Ich kann allerdings nicht sagen an was es lag... nach einem Neustart von The Bat arbeitete alles wieder wie vorher. Vermute mal The Bat hat die Nachrichten irgendwie nicht an Regula abgegenem.

  • Zitat

    Hatte gerade eben gleiches Problem?! Regula scheint gestartet zu sein (Regula: 248 rules loaded totally. Give me Spam!), aber keine einzige Nachricht wurde gefiltert. Ich kann allerdings nicht sagen an was es lag... nach einem Neustart von The Bat arbeitete alles wieder wie vorher. Vermute mal The Bat hat die Nachrichten irgendwie nicht an Regula abgegenem.


    Wenn das Plugin bei der Verarbeitung einen Fehler verursachen würde, müsste entweder davon etwas in der Log-Datei stehen, oder der betreffende Log-Eintrag etwa so aussehen:

    Code
    === MESSAGE ===
    Process message: ID <...@...>
            Subject: ...
               From: ...
               Date: Thu, 21 Apr 2005 10:15:40 +0200 (CEST)
      Started:  21.04.2005 11:45:27.
      Finished: 21.04.2005 11:45:27.
    ...
  • Zitat

    Wenn das Plugin bei der Verarbeitung einen Fehler verursachen würde, müsste entweder davon etwas in der Log-Datei stehen, oder der betreffende Log-Eintrag etwa so aussehen:


    Es stand nichts im Log - absolut garnichts. Nur die Startmeldung des Plugins (wieviele Regeln geladen wurde etc.). Wie gesagt, ich vermute da eher das The Bat die Nachrichten nicht weitergereicht hat.

  • Zitat

    Geplant ist egentlich nichts, mir fällt auch nicht wirklich was sinnvolles ein.
    Aber wenn du Vorschläge hättest...


    Nun ja, da würden mir schon ein paar Sachen einfallen. Zum einen finde ich es schade, daß eine Regel nur einmal Punkte bringt, auch wenn sie mehrmals zutreffen würde.
    Wenn man z.B. ein Badword mehrfach in der Mail vorkommt, wäre es meiner Ansicht gut, wenn es auch jedes Mal dafür Punkte gäbe oder wenn mehrere externe Bilder in der Mail vorhanden sind, dann gibt es nur einmalig punkte.
    Das würde die Erkennung von Spam sicherlich teilweise vereinfachen, wenn es da für alle Vorkommen Punkte gäbe.

    Für SpamPal gibt's ein schönes Plug-In namens HTMLModify. Wenn man gewisse Sachen zur HTML-Analyse einbauen würde, dann wäre das sicherlich sinnvoll.
    Für jedes nicht konforme HTML-Tag z.B. Punkte vergeben oder für HTML-Kommentare etc., so kann man Spammails im HTML-Format sicherlich effektiver erkennen.
    Weitere Erkennungsmerkmale gibt's auf der Homepage: http://www.ib-hoebel.de/SpamPal/default_german.htm
    Läßt sich sicherlich auch über RegEx teilweise lösen, aber da mehrfache Vorkommen summiert werden, wäre eine Extrafunktion sicherlich nützlich.

    Zitat

    Was ist eigentlich aus den nicht ganz so aggresiven Regeln geworden die mal jemand ausgearbeitet hatte?


    Damit bin sicherlich ich gemeint. Wenn daran Interesse besteht, dann kann ich es ja mal veröffentlichen.

    Gruß,
    Zocko

  • Zitat


    Ich nicht. Wie man ein Plugin einbindet setze ich voraus.


    Jo, meinetwegen.
    Ich hab's ja auch richtig gemacht. Nur lief das Plugin nicht (wie erwartet - bzw. war nach Neustart verschwunden) und daher kam bei mir die Frage auf, ob es denn wirklich richtig installiert sei. Ergo der Wunsch nach einer genauen Installationsbeschreibung, damit der Punkt zumindest klar ist (auch bei anderen Leuten - denn ich lese hier genug von denselben Problemen bei anderen).

    Zitat


    ...ist das Regula Plugin nicht gedacht und darum auch nicht darauf ausgelegt.


    Ok, Haken dran. War mir allerdings vorher nicht klar.
    Könnte vielleicht auch etwas deutlicher dargestellt werden.
    Ok, Du schreibst

    Zitat

    Zusätzlich können Absender mittels "Als Nicht-Spam klassifizieren" automatisch als "Whitelisted" festgelegt werden

    . Das lässt einen aber nicht direkt vermuten, dass die umgekehrte Funktion nicht geht!

    Zitat


    "Zu uncool"?!? :blink:
    Nein.


    Na dann... ;)

    Zitat


    Man kann das Regula Plugin nicht "anlernen".
    Nach 20 Einträgen in die Datei durch wahllose Markierung als "Nicht-Spam" sowie bei der Markierung von über 100 Mails war kein Fehler zu sehen. Obgleich diese Funktion nur zum Markieren von einzelnen Absendern gedacht ist und auch nur so verwendet werden sollte.


    Ist nirgendwo beschrieben, dass das nur auf einzelne Mails angewendet werden soll.

    Zitat


    Kannst du den Vorgang mal im Detail beschreiben, damit ich den Fehler nachvollziehen kann?


    Hm, ich habe (nach den Erfahrungen an den "Schwiegereltern-Rechnern") erstmal knapp 15 Mails markiert und per Extras / Als Nicht-Spam klassifizieren dem Plugin angeboten. Nach einer Weile kam eben besagte Meldung.
    Ich schau in die "autowhitelist.txt" (oder wie sie hieß, hab sie nicht mehr) und sehe nur vier Absender eingetragen.
    Nun hatte ich in der ersten Auswahl ein, zwei Absender doppelt. Dann habe ich andere Mails ausgewählt, von noch nicht ge-whitelisteten Absendern.
    Selbes Ergebnis, Fehlermeldung.
    Nachher hab ich es mit einzelnen Mails probiert. Da ging es mal und mal ging es wieder nicht.

    Genauer kann ich es Dir leider wirklich nicht sagen :rolleyes:
    Kann höchstens dazu sagen, dass ich The Bat 3.0.1.33 verwende...

    Aber wer weiß, woran diese Probleme liegen.
    Wenn Du die bei Dir nicht nachvollziehen kannst, sieht es mit dem Bugfixing schon schlecht aus.
    Kenne das Problem, da kann man nur im Trüben stochern...

    ~Alex

  • Zitat

    Zum einen finde ich es schade, daß eine Regel nur einmal Punkte bringt, auch wenn sie mehrmals zutreffen würde.


    Das wird sich nicht so einfach machen lassen (vor allem bei den regulären Ausdrückem).

    Zitat

    Für SpamPal gibt's ein schönes Plug-In namens HTMLModify. Wenn man gewisse Sachen zur HTML-Analyse einbauen würde, dann wäre das sicherlich sinnvoll.


    Ich werde es mir mal genauer ansehen. Eventuell finde ich ja was passendes, das man als interne Regel einbauen könnte.

  • Zitat


    Ich werde es mir mal genauer ansehen. Eventuell finde ich ja was passendes, das man als interne Regel einbauen könnte.


    Das hört sich doch schon mal super an :thumbup:
    Wäre toll, wenn die internen Regeln dahingehend noch etwas erweitert werden könnten :)

    BTW:
    Habe vorhin eine Spammail bekommen, die glatt durchgegangen ist. Hat wer weiß wieviele externe Bilder drin, aber die Regel, die sonst darauf anspringt, hat leider nichts gefunden. Hier mal ein Auszug:


    Könnte man an der Erkennung vielleicht noch was machen?

    Gruß,
    Zocko

    Einmal editiert, zuletzt von Zocko (22. April 2005 um 14:35)

  • Zitat

    Habe vorhin eine Spammail bekommen, die glatt durchgegangen ist. Hat wer weiß wieviele externe Bilder drin, aber die Regel, die sonst darauf anspringt, hat leider nichts gefunden.


    Und welche Regel spricht sonst darauf an?

    Ich wüsste nicht welche in Regula enthaltene Regel darauf ansprechen sollte.
    Aber du kannst ja eine der vorgegebenen HTML-Regeln anpassen bzw. eine neu Regel dafür erstellen.

  • Also normalerweise sollte diese Regel drauf ansprechen:

    Code
    HtmlPart 75 R "<a\s.*<img\s.*>" [HTML_IMG_LINK: Link mit Bild]
    Code
    HtmlPart 30 R "<img\s.*http://.*>" [HTML_EXTERNAL_IMAGE: Mail mit nachzuladenem Bild]

    Ich werde \s rausnehmen, dann sollten beide Regeln gehen.

    Einmal editiert, zuletzt von Zocko (22. April 2005 um 16:08)

  • Hallo und Guten Morgen Gaijin

    Leider kann ich mich erst heute wieder melden. Hatte im Hotel ziemlich viel Arbeit.

    Dein Hinweis mit der DNS-Auflösung war ein voller Treffer. Ich habe bei mir zu hause die DNS Einstellungen geändert. Also nicht die vom Router genommen, sondern vorgegebene von 1und1. Und siehe da, es funktioniert ohne Timeouts. Kann also jetzt die Blacklist zu hause benutzen.
    Hier im Hotel muss ich mal schauen wie ich das mache. Denn da sind DNS-Adressen vorgegeben. Vielleicht fällt mir da etwas ein.

    Auf alle Fälle noch einmal Danke für Deinen Tip.

    Es grüßt ganz herzlich aus dem schönen Land an der blauen Müritz
    neko_63