[Suche] Idee zum Verschieben von Betreff-Duplikat-Mails in anderen Ordner

  • Folgender Sachverhalt:

    Wir nutzen TB! auf einem eigenen PC zur automatischen Spam-Vorprüfung für ca. 20 Konten im Unternehmen. Dabei kommt eine Kombination aus SpamPal, RegEx und zusätzlichen manuellen Textfiltern zum Einsatz, die eine sehr hohe Trefferquote hat.

    Zur Zeit werden rund 2.000 Mails pro Tag (Tendenz natürlich weiter steigend) in Spam-Ordner zur manuellen False-positive-Überprüfung verschoben, die ein Kollege im Moment noch jeden Tag durchsieht (und damit 30 Minuten verbrät, um 1-2 Mails als echt zu identifizieren).

    Viele Spam-Mails kommen natürlich mehrfach an, so dass ich vorhabe, diese alle automatisch identifizieren zu lassen und gar nicht mehr manuell zu überprüfen. Aber jetzt fehlt mir der technische Einstieg in die Lösung.

    Ich habe also einen Ordner "Neuer Spam", in dem manche Mails dieselbe Betreffzeile haben. Dies können 2 Mails sein, aber gut und gerne auch mal 50 Mails mit identischem Betreff. Wie kann ich nun genau diese filtern und in einen anderen Ordner verschieben "Multi-Spam ungeprüft"?

    Diese bewahren wir dann noch vorsichtshalber 90 Tage auf und lassen Sie dann durch regelmäßige Reorganisationsläufe automatisch löschen. So verwalten wir im Moment in TB! um die 100.000 Nachrichten.

    Freue mich sehr über jede Anregung.

    Herzliche Grüße

    Uwe

    ... der in diesem Forum schon einige Jahre mitliest, aber bisher immer alle benötigten Infos so gefunden hat. Danke daher heute auch für die bisherigen super Beiträge. :D

  • Also handelt es sich nur um SPAM-Nachrichten, die wirklich Spam sind und handverlesen sind?

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Also in dem zu durchsuchenden Ordner landen alle die Mails, die SpamPal und meine manuellen Filter als Spam identifiziert haben und dann per Filter aus dem Posteingang in den Spam-Ordner verschoben werden. 99,5% sind dann wirklich Spam, 1 oder 2 allerdings sind "False-Positives".

    Jetzt möchte ich eben nicht jeden Tag alle 2000 Betreff-Zeilen lesen müssen, um die "FP" zu finden, sondern erst einmal alle "gleichen Blöcke" automatisch wegwerfen. Die erkenne ich im Moment nur manuell daran, wenn ich den Ordner nach Betreff sortieren lasse und dieselben Spams dann visualisiert erkenne und löschen kann. Aber dennoch muss ich natürlich viele Seiten lang blättern und sehr konzentriert schauen.

    Und genau das möchte ich gerne technisch automatisierter lösen, so dass ich danach nur noch alle "einzelnen" Mails (und keine Duplikate) manuell prüfen muss.

    Ich suche also eine Möglichkeit, in einem Ordner Mails mit identischem Textstring im Subject (oder vielleicht sogar auch im Text) zu erkennen und diese dann zu verschieben.

    Ist so etwas machbar? Mir ist das theoretisch klar, praktisch aber einige Stufen zu hoch.

  • Hallo Bernd,

    grundsätzlich ein sinnvoller theoretischer Ansatz, aber wie exportiere ich nur die "richtigen" Betreffs, also die mit mehrfachem identischem Inhalt? Und wie richte ich Filter 2 in TB ein?

    Nach diesem relativ ruhigen Spam-Wochenende hatten wir rund 4.800 Mails in unseren Prüf-Ordnern, davon genau 3 False-Positives - Zeitaufwand ziemlich genau 60 Minuten zum Durchschauen. :(

    Optisch sieht TB dann nach so einem Wochenende so aus:

    [Blockierte Grafik: http://www.uahh.de/blog/wp-content/tb_sum.gif] [Blockierte Grafik: http://www.uahh.de/blog/wp-content/tb_sort2.gif]

  • Anregung:

    1.0 Prüfe Spambetreff aus externer Datei
    1.1 Ja: Lösche Spam
    1.2 Nein: Schreibe Betreff mit Zeitstempel in Datei
    2.0 Schreibe Spambetreff in externe Datei in Form von
    2.1 Wartungslauf zum Löschen von Betreffs > 100 Tage

    Dateiformat: JJMMTT=Spambetreff

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

    Einmal editiert, zuletzt von beta (10. Juli 2007 um 07:45)

  • Mal was ganz anderes: Warum nicht erstmal einen Filter erstellen, der Mails mit bestimmten Wörtern im Text/Betreff gleich löscht ohne sie im Spam-Ordner zu halten? Ihr bekommt ja geschäftlich keine Mails die etwas mit "weight" oder "sexual" zu tun haben, oder? ;)

  • beta

    So in der Art habe ich mir das auch vorgestellt, allerdings wird das wohl nur über die Einbindung von externen Programmen funktionieren. Zumindest habe ich nichts geeignetes in den Bordmitteln von TB gefunden.

    Bernd

    Das werde ich auf jeden Fall in den nächsten Tagen umsetzen. Einschränkend bekommen wir aber natürlich leider tatsächlich weltweit Geschäftspost - und entsprechend kommen auch typische Spam-Begriffe häufiger "in Echt" vor. Die Definition und ständige Pflege eines eigenen Spam-Filters zum Löschen wollte ich mir eigentlich ersparen, aber ich komme wohl nicht drumherum.


    Falls noch jemand eine Idee hat, wie ich die oben gezeigten Mehrfach-Spams automatisch eliminieren kann - immer her damit. ;) Oder wie kann ich das am Besten und mit Nachdruck Richtung Ritlabs für die kurzfristige Wunschliste bekommen? Denn so eine ähnliche Funktion gibt es ja schon in der Ordnerwartung mit dem Schalter "Duplikate löschen". Dies offener gestaltet wäre meine Lösung. ;)

  • Macht es Sinn dir was zu stricken?

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.