Kyrillische Kodierung filtern

  • Hallo Gaijin,

    ich möchte mit dem ASP nach kyrillischen Kodierungen suchen, da ich aber zu PartEncode kein Beispiel in den Rules gefunden, bin ich mit meiner Regel etwas unsicher:

    Zitat

    PartEncode 90 S "koi8-r" [ENCODE_CYRILLIC: kyrillische Kodierung]

    Diese Kodierung wurde zum Beispiel bei den Phisingmails der Telekom und der Postbank benutzt, die ansonsten täuschend echt aussahen.

    Hier der Quelltext einer dieser Phisingmails (Nett, dass die Phiser auch TB nutzen *g*):


    -piktor-

    Beitrag wurde verschoben. Bitte wirklich nur fertige und bewährte Filterregeln im Filterregel-Thread posten!

    Einmal editiert, zuletzt von Manu (13. Februar 2005 um 21:45)

  • @piktor:
    Bei "PartEncode" ist die Kodierung des Inhaltes (mime, base64 etc.) gemeint.

    Deine Regel müsste so aussehen:

    Code
    OSubject 90 SB "=?koi8-r?" [SUBJ_CYRILLIC: Betreff ist Kyrillisch]

    Die einzelnen Message-Parts sollten nur dann geprüft werden, wenn es nicht anders geht, da hier viel mehr Daten gelesen werden müssen, was die Verarbeitungsgeschwindikeit herabsetzt. Allerdings, wenn es irgendwo bereits notwendig geworden ist, kann man es auch in mehreren Regeln verwenden, da die Daten pro Nachricht nur einmal ermittelt werden und dann macht es keinen großen Unterschied mehr.

    Bei dieser Mail kannst du auch diese Regel verwenden (wenn im Betreff nicht immer eine kyrillische Konvertierung verwendet wird):

    Code
    PartCharSet 90 S ""koi8-r"" [PARTCHARSET_CYRILLIC: MessagePart ist Kyrillisch]

    Edit: 1. Regel korrigiert!

  • Hallo Gaijin,

    zuerst mal herzlichen Dank für die prompte Antwort! :)


    In diesem Zusammenhang habe ich noch zwei Fragen:

    1.) Mir sind die doppelten Anführungszeichen nicht ganz klar:

    Code
    PartCharSet 90 S ""koi8-r"" [PARTCHARSET_CYRILLIC: MessagePart ist Kyrillisch]


    es müsste doch auch folgendes gehen:

    Code
    PartCharSet 90 S "koi8-r" [PARTCHARSET_CYRILLIC: MessagePart ist Kyrillisch]


    Wenn ich Deine Anleitung richtig verstanden habe, stehen die Ergebnisse von PartCharSet in einer Liste, bei der jeder einzelne Eintrag in Anführungszeichen steht. Für die Prüfung müsste es doch dann egal sein, ob um den zu prüfenden Text (koi8-r) die Anführungszeichen stehen.
    Oder habe ich jetzt einen Denkfehler?


    2.) Mir ist der Unterschied zwischen den Varianten Subject und OSubject (das Gleiche bei To, From, etc.) nicht ganz klar.
    Wenn ich in TB eine Mail beantworte ist mir der Unterschied schon klar, bei Subject handelt es sich um den Betreff der Mail, die ich gerade schreibe und bei OSubject um den Betreff der Originalmail. Aber wo ist der Unterschied bei der SPAM-Prüfung einer eingehenden Mail?

    -piktor-

  • Zitat

    Wenn ich Deine Anleitung richtig verstanden habe, stehen die Ergebnisse von PartCharSet in einer Liste, bei der jeder einzelne Eintrag in Anführungszeichen steht. Für die Prüfung müsste es doch dann egal sein, ob um den zu prüfenden Text (koi8-r) die Anführungszeichen stehen.


    In diesem Fall ist es nicht besonders relevant, wenn man die Anführungszeichen dazuschreibt, wird sichergestellt dass nach dem Zeichensatz "koi8-r" und beispielsweise nicht nach "koi8-rx" oder "xkoi8-r" gesucht wird. In anderen Fällen könnte sich diese "Feinheit" durchaus auswirken.

    Zitat

    Mir ist der Unterschied zwischen den Varianten Subject und OSubject (das Gleiche bei To, From, etc.) nicht ganz klar.
    Wenn ich in TB eine Mail beantworte ist mir der Unterschied schon klar, bei Subject handelt es sich um den Betreff der Mail, die ich gerade schreibe und bei OSubject um den Betreff der Originalmail. Aber wo ist der Unterschied bei der SPAM-Prüfung einer eingehenden Mail?


    Das darfst du keinesfalls verwechseln. The Bat! unterscheidet zwischen der Originalnachricht und den Angaben, die du im Nachrichteneditor angegeben hast oder angeben willst z.B. mit %SUBJ=...
    Das ASP bezieht sich nur auf die Nachricht, die geprüft wird, also die gerade empfangen wurde.

    Folgende Unterschiede bezüglich des Betreff gibt es im ASP:
    "OSubject" wird von TB! an das ASP übergeben und ist auch der Originalbetreff, so wie er im Header steht.
    "Subject" wird von TB! an das ASP übergeben und enthält den dekodierten Betreff.
    "Subj" wird auch von TB! an das ASP übergeben und enthält den dekodierten Betreff, der zusätzlich in das Format der eingestellten lokalen Windows-Codepage konvertiert wurde.
    Somit sind hauptsächlich "Subj" und "OSubject" relevant.

    Bei "OTo" handelt es sich um den (evtl. kodierten) Empfänger, wie er im Header steht. Bei "To" handelt es sich um den dekodierten Empfänger, wie er in The Bat! angezeigt wird. Sind keine Sonderzeichen im To-Header, ist "OTo" und "To" gleich.

  • Zitat

    Folgende Unterschiede bezüglich des Betreff gibt es im ASP:
    "OSubject" wird von TB! an das ASP übergeben und ist auch der Originalbetreff, so wie er im Header steht.
    "Subject" wird von TB! an das ASP übergeben und enthält den dekodierten Betreff.
    "Subj" wird auch von TB! an das ASP übergeben und enthält den dekodierten Betreff, der zusätzlich in das Format der eingestellten lokalen Windows-Codepage konvertiert wurde.
    Somit sind hauptsächlich "Subj" und "OSubject" relevant.

    Bei "OTo" handelt es sich um den (evtl. kodierten) Empfänger, wie er im Header steht. Bei "To" handelt es sich um den dekodierten Empfänger, wie er in The Bat! angezeigt wird. Sind keine Sonderzeichen im To-Header, ist "OTo" und "To" gleich.

    Hallo Gaijin,

    danke für Deine ausführliche Antwort!

    Jetzt habe es auch ich verstanden :rolleyes:

    -piktor-