Regula Plugin 1.6.1

  • Ich habe heute zwei Spammails bekommen – müssen wohl vom selben Spammer sein ;) – die alle gleiche Fehler enthielten.
    In der Nachricht wurde

    Code
    %DOMAIN_FROM
    %MAIL_FROM
    %MAIL_TO
    %NAME_FROM
    %NAME_TO


    verwendet. Eigentlich wäre ja die interne Regel BulkForm dafür verantwortlich, aber die kennt die Wörter nicht. Wird die Regel u.U. erweitert oder ist es besser, wenn ich mir selber separate Regeln anlege?

    Gruß,
    Zocko

    P.S.
    Die neue interne Regel läuft bisher nach wie vor fehlerfrei :)

    Einmal editiert, zuletzt von Zocko (14. Oktober 2005 um 11:31)

  • Nachtrag:
    Ich glaube, ich habe einen Bug gefunden. Laut dem RegulaManager wird die Regel:

    Code
    # *** US-ASCII-Zeichensatz *** (2005-01-04)
    Charset 20 S "us-ascii" [HEADER_CHARSET_US-ASCII: US-ASCII-Zeichensatz]

    nie wahr, obwohl viele Spammails entsprechende Einträge aufweisen:

    Code
    Content-Type: text/plain; charset="us-ascii"
  • Zitat

    Ich habe heute zwei Spammails bekommen – müssen wohl vom selben Spammer sein ;) – die alle gleiche Fehler enthielten.
    In der Nachricht wurde

    Code
    %DOMAIN_FROM
    %MAIL_FROM
    %MAIL_TO
    %NAME_FROM
    %NAME_TO


    verwendet. Eigentlich wäre ja die interne Regel BulkForm dafür verantwortlich, aber die kennt die Wörter nicht. Wird die Regel u.U. erweitert oder ist es besser, wenn ich mir selber separate Regeln anlege?


    Ich habe heute eine Mail bekommen, die diese Wörter auch hatte. Ich habe die interne Regel entsprechend erweitert (noch nicht veröffentlicht).

    Zitat

    Die neue interne Regel läuft bisher nach wie vor fehlerfrei :)


    Sehr gut, danke. Bei mir läuft es auch einwandfrei.

    Zitat

    Ich glaube, ich habe einen Bug gefunden.


    Das werde ich gleich mal überprüfen...

    Edit:
    ... Bei mir werden in der Statistik 36 Treffer angezeigt. Die Regel funktioniert also.
    Was natürlich sein kann ist, dass diese Regel nie überprüft wird, weil die Verarbeitung bereits vorher auf Grund des erreichten Maximalscores abgebrochen wurde. Die Regel ist immerhin relativ weit hinten (im letzten Drittel der gesamten Regeln).

  • Zitat

    Ich habe heute eine Mail bekommen, die diese Wörter auch hatte. Ich habe die interne Regel entsprechend erweitert (noch nicht veröffentlicht).


    Klasse, dann brauche ich ja keine neuen Regeln einfügen :)

    Zitat

    Edit:
    ... Bei mir werden in der Statistik 36 Treffer angezeigt. Die Regel funktioniert also.
    Was natürlich sein kann ist, dass diese Regel nie überprüft wird, weil die Verarbeitung bereits vorher auf Grund des erreichten Maximalscores abgebrochen wurde. Die Regel ist immerhin relativ weit hinten (im letzten Drittel der gesamten Regeln).


    Hmm, ich werde es später noch mal testen. Aufgefallen war mir das, weil die Regel bei mir nicht aktiv wurde und direkt danach auch schon Bayes kam.
    Danach hatte ich Bayes rausgenommen und die Regel sprach trotzdem nicht an, wurde wegen Wegfall von Bayes sogar nicht mehr als Spam erkannt.

    Kann es denn sein das die Regel bei mir nicht ausgeführt wird, weil ein Fehler in meinem Filterset ist, so daß dahinter befindliche Regeln nicht abgearbeitet werden? Fehler werden im Log allerdings keine angezeigt.

  • Zitat

    Aufgefallen war mir das, weil die Regel bei mir nicht aktiv wurde und direkt danach auch schon Bayes kam.
    Danach hatte ich Bayes rausgenommen und die Regel sprach trotzdem nicht an, wurde wegen Wegfall von Bayes sogar nicht mehr als Spam erkannt.


    Das sollte nicht der Fall sein. Kannst dur mir bitte ein oder zwei Spams schicken (als Anlage), bei denen diese Regel nicht funktioniert hat.

    Zitat

    Kann es denn sein das die Regel bei mir nicht ausgeführt wird, weil ein Fehler in meinem Filterset ist, so daß dahinter befindliche Regeln nicht abgearbeitet werden? Fehler werden im Log allerdings keine angezeigt.


    Nein, das würde einerseits im Protokoll stehen, andererseits würde die Verarbeitung bei der nächsten Regel weitergehen.

  • Hallo Gaijin,

    habe dir drei Spammails geschickt. Ich vermute mal es könnte damit zusammenhängen, weil in den Mails einmal steht:

    Code
    Content-Type: text/html; charset="us-ascii"

    und zum anderen

    Code
    <META http-equiv=3DContent-Type content=3D"text/html; charset=3Diso-8859-1">


    könnte es sein, das Regula intern mit dem zweiten Wert arbeitet?

  • Zitat

    habe dir drei Spammails geschickt.


    Vielen Dank!

    "CharSet" gibt nur den Zeichensatz der gesamten Nachricht (z.B. bei Text-Only) zurück. Alle in der Mail verwendeten Zeichensätze - also auch in den einzelnen Parts - werden von "PartCharSet" zurückgegeben.

    Ändere die Regel auf:

    Code
    PartCharSet 20 S "us-ascii" [HEADER_CHARSET_US-ASCII: US-ASCII-Zeichensatz]

    und es wird funktionieren.

    Regula bietet inzwischen schon ganz viele Möglichkeiten, die kenn' ich nicht mal mehr... :lol:

  • Zitat

    Regula bietet inzwischen schon ganz viele Möglichkeiten, die kenn' ich nicht mal mehr... :lol:


    He He, danke für den Hinweis, hab's bei mir geändert ;)

    BTW:
    Kommt es in normalen Mails eigentlich auch vor, daß unterschiedliche Charsets benutzt werden? Wäre ansonsten noch 'ne Möglichkeit Spam zu erkennen... :denk:

    Einmal editiert, zuletzt von Zocko (15. Oktober 2005 um 13:42)

  • Ich habe bei mir auch noch mal nachgesehen und scheint wirklich ein Sonderfall zu sein. Dann lohnt sich natürlich eine spezielle Regel nicht.