Beiträge von Gaijin

    Zitat


    Eine abgrundtiefe Abneigung gegen das .NET Framework hindert mich daran, dies zu installieren. 280 MB die das System zumüllen und nicht restlos entfernt werden können, müssen nicht sein.


    Du brauchst zwar nur 22,4 MB für .NET 2.0 oder alternativ dazu 34,1 MB für .NET 2.0 SP1 (enthält benötigte Dateien für .NET 1.0 und 2.0), aber ganz wie du meinst.

    Auf Grund der bevorstehenden und vergangenen Veränderungen an The Bat! (und div. anderen Gründen) habe ich eine Alternative zum Regula Anti-Spam Plugin namens "Phalanx" entwickelt.

    Phalanx ist ein Anti-Spam-Filter für POP3-Konten, der eigenständig und unabhängig vom eingesetzten Mailprogramm arbeiten kann. Phalanx unterstützt bei der Anmeldung am Mailserver auch APOP (MD5) und sichere Verbindungen (SSL).

    Soweit dies technisch möglich war, habe ich alle Features von Regula integriert. Dabei habe ich zwar versucht, die Konfiguration der Filtermethoden zu vereinfachen, aber das Hauptaugenmerk liegt, wie auch bei Regula, auf einer möglichst hohen Flexibilität.

    Phalanx kann von meiner Webseite herunter geladen werden.* (Anmerkung s.u.)

    Vorerst akzeptiert das Programm nur Verbindungen vom lokalen Rechner (127.0.0.1).
    Es wird das .NET Framework 2.0 benötigt.

    Abschließend habe ich noch einige Änderungen, Erweiterungen und sonstige Unterschiede - speziell bei der Verwendung mit TB! - kurz zusammengeschrieben, damit sich jeder einen besseren Überblick verschaffen kann:

    • Phalanx arbeitet, im Gegensatz zu Regula, mit mehreren Threads gleichzeitig, was die Geschwindigkeit beim Abfragen der Nachrichten erhöht.


    • Mit Phalanx können auch die Kopfzeilen von Nachrichten überprüft werden, die von The Bat! während der "selektiven Übertragung" angefordert werden. Dadurch kann auf die Verwendung von unzähligen Filtern in The Bat! zum Löschen von eindeutigen Spam-Mails verzichtet werden. Die Filter zum Löschen bzw. Ignorieren von Nachrichten befinden sich im Ordner "Setup\The Bat!".


    • Benutzerdefinierte Regeln können in den Optionen einfacher erstellt werden.


    • Die Reihenfolge der Filter (Adresslisten, DNSBL, URLBL, Bayes-Filter, Regelsets und Plugins) kann im Optionsdialog beliebig festgelegt werden.


    • Phalanx unterstützt Plugins, wodurch umfangreichere oder kompliziertere Filteraufgaben einfacher ausgeführt und konfiguriert werden können.


    • Phalanx kann, im Gegensatz zu Regula, Regelsets, Adresslisten und diverse andere Dateien während der Programmausführung neu laden, ohne dass das Programm neu gestartet werden muss.


    • In Phalanx werden beliebig viele Regelsets unterstützt (in Regula nur entweder Rules.dat oder EasyRules.dat). Dadurch können diese leicht ausgetauscht, gereiht und auch deaktiviert werden.


    • In Phalanx sind beliebig viele Black- und White-Listen möglich (als externe Dateien), zusätzlich können auch Adressen von Mailinglisten ausgenommen werden. Neben Adressen können in Phalanx auch Namen in die internen Listen aufgenommen werden.


    • Die Filter-Statistik (Regel-Statistik) kann jetzt mit wesentlich umfangreicheren Protokollen (schneller) arbeiten.


    • Die DNSBL- und URLBL-Server können im Einstellungsdialog einfacher bearbeitet, gereiht und aktiviert bzw. deaktiviert werden. Weiters kann für jeden Server ein individuelles Timeout und ein eigener Score definiert werden.


    • Die Regeln vom Regula-Plugin und Phalanx sind nicht kompatibel. Der Aufbau und viele Datenfelder (Headernamen) sind zwar identisch, jedoch wurden einige Datenfelder entfernt bzw. neue hinzugefügt. Die Regeloptionen unterscheiden sich ebenfalls in einigen Punkten. Das Überprüfen der Optionen in den einzelnen Regeln ist auf jeden Fall notwendig. Beispiele für Regelsets bzw. für Regeln sind im Ordner "Setup\Sample Rulesets" enthalten.


    • Beim Bayes-Filter können Nachrichten nicht direkt aus TB! heraus reklassifiziert werden. Dafür können Nachrichten über ein eigenes Fenster als Spam oder Ham gelernt oder umgelernt werden. Auch das Entfernen von gelernten Nachrichten oder das Hinzufügen von nicht gelernten Nachrichten ist möglich.


    • Die Auto-Whitelist für gesendete Nachrichten steht in Phalanx nicht mehr zur Verfügung. Die Datei mit den exportierten Adressen kann aber in die Liste der Whitelists aufgenommen werden. Die Funktionsweise dieses Features ändert sich somit nicht. Der entsprechende Filter für The Bat! ist im Ordner "Setup\The Bat!" zu finden. Weiters sollte die Option "Adresslisten auf Änderungen überwachen" aktiviert werden, damit die Adressen ausgehender Nachrichten sofort zur Verfügung stehen.


    • Das Adressbuch von TB! kann nicht mehr direkt ausgelesen werden, allerdings kann Phalanx LDIF-Dateien lesen und Adressen aus Textdateien extrahieren (der Export von LDIF-Dateien wird von TB! unterstützt).

    * Anmerkung von Sanyok:

    Da das Tool auf der offiziellen Webseite wohl nicht mehr angeboten wird, findet ihr die letzte v1.3.1 hier im Anhang zusammen mit dem kompletten Changelog:

    Zitat


    wurde mit der neuen Version die Erkennungsleistung erhöht?

    Ich habe seit geraumer Zeit das Problem, das selbige bei nur ca. 50-60% liegt und massig false-positives produziert werden. Filter komplett neu anlernen bringt leider gar nichts.


    Überprüfe bitte die Statistik (in den Einstellungen) und das Protokoll, evtl. auch die Regel- und DNSBL-Statistik im Regula-Manager.

    Trotz vieler Test-Mails, die die Effizienz herabsetzen, habe ich eine Erkennungsrate von 99.72%.

    In dieser Version (von 2.2.6 auf 2.2.7) reicht das updaten der Regula.tbp und der Hilfedatei (Regula.chm), da sich bei ein paar Regeln auf Grund der neuen Plugin-API was geändert hat.

    Betroffen davon sind die Regeln "Sender" - diese ist nun identisch mit "From", sowie "Subj" - welche jetzt die selben Daten zurückgibt wie "Subject".

    Diese "nervige" Meldung wird dann angezeigt, wenn ein Benutzer den Bayes-Filter verwenden möchte, aber weniger als 50 Ham- bzw. Spam-Nachrichten angelernt hat. Mit so wenigen Nachrichten kann der Bayes-Filter kein sinnvolles Ergebnis liefern. Entweder man lernt mindestens 50 Ham- UND Spam-Nachrichten an, oder man schaltet den Bayes-Filter aus. In beiden Fällen wird die Meldung dann nicht mehr angezeigt.

    Aber ab TB! 4.0 bzw. eine der kommenden Betas wird es das Plugin nicht mehr geben. Es ist ja ohnehin "echt das Letze"... (@drfo: Danke für die netten Worte.)

    Zitat


    Ich hätte es aber toll gefunden, wenn du eine Möglichkeit geschaffen hättest statt der Kommas andere Zeichen als Trenner der Adressen alternativ zuzulassen.


    Beistriche sind die richtigen Trennzeichen, aber auch mit einem anderen Trennzeichen wird eine korrekte Formatierung der Adressen notwendig sein.

    Zitat


    Mit ein wenig Programmierfleiß hätte man da sicherlich was lösen können.


    Vermutlich.

    Zitat


    ""\"xxxxxx xöxx - xxxxxxxxxxxxüxx xxxxxx\"" <xxx@xxxxxxxxxx-xxxxxx.xx>, xxxxxxxxx, xxxxx - xxx-x1" <xxxxx.xxxxxxxxx@xxx-x.xxx.xxxxxxx.xx>


    Weder TB!, noch ein anderes Programm werden diese Adresse verstehen - TB! zumindest nicht. Die Anführungszeichen sind auf jeden Fall falsch maskiert (""\" am Anfang und \"" in der Mitte), somit wird es wohl weder mit einem Programm, noch mit einem regulären Ausdruck möglich sein, die gewünschte Adresse zu erhalten.

    Zitat


    Warum und wozu? Ich möchte die korrekte Anzahl von wirklichen E-Mailadressen eventuell mit den verunglückten E-Mailadressen zwischendrin ermitteln. Teilweise sind Absenderadressen recht krude. Backslashs, mehrere Kommas. Die XMP-Funktionen ermitteln dann die Adressen nicht richtig. Das einzige, was korrekt ist sind die E-Mailadressen. Mit einem entsprechenden regexp müßte man da rankommen. Oder?


    Kannst du bitte mal ein Beispiel posten, bei dem die Adressen nicht richtig ausgelesen werden können?

    Zitat


    Ich meine, das Problem entsteht doch dadurch, dass eine From-Adresse die in der beschriebenen Form in einer eingehenden Email vorhanden ist beim Antworten als To-Adresse von den XMP_List...-Funktionen offensichtlich als drei Adressen interpretiert wird...oder?


    Nein, das Problem entsteht dadurch, dass sowohl "ABTOName" als auch "XMP_ListName" den Namen ohne Anführungszeichen zurückgeben. In beiden Fällen musst du sie selbst hinzufügen - und das passiert in der Vorlage im ersten Posting aber nicht. ;)

    Ändere die letzte Zeile in der For-Schleife auf

    Code
    %%_NEW='%%_NEW"%%_N" <%%TO>'%%-

    und dann sollte es funktionieren.

    Zitat


    Wieso 14?


    Weil es 14 Zeilen sind. ;)

    Zitat


    XMP_GREP liefert nur 13 Zeilen zurück, wenn ich die Doku richtig verstehe.


    Ja und nach jeder Zeile kommt ein Zeilenumbruch. :D
    Wenn du das Ergebnis von XMP_Grep so verwenden willst, musst du den Zeilenumbruch am Ende abschneiden.

    Zitat


    Ich hätte noch einen Verbesserungsvorschlag für %XMP_StrLines. Könnte man nicht die 2 optionalen Parameter weglassen, wenn nichts angegeben wird?


    Danke, ich werde das ändern.