Seit Jahren versuche ich Spam zu bekaempfen habe aber vor laengerer Zeit aufgegeben. Es ist viel einfacher Spameingang zu kontrollieren. Im Durchschnitt benoetige ich mehr als 200 Regeln, um meine Mails als Spam zu klassifizieren. Die Spammer nicht die Duemmsten und neue Verfahren oder neue Tricks erfordern zusaetzliche, neue Regeln. Die alten Regeln koennen meistens nicht geloescht werden, da nicht alle Spammer zur gleichen Zeit das Verfahren aendern. Ich habe nicht genuegend Zeit, um eine Software wie z.B. ASP zu schreiben, habe aber Nachforschungen angestellt und moechte das Ergebnis hier in ein paar Worten darstellen und zur Diskussion anbieten. ASP waere meines Erachtens bestens geeignet.
Ziemlich alle Spamprogramme pruefen Mails nach "Kennworten", die dann ausgewertet werden und die Summe der Auswertung ist dann entscheidend. Vor Jahren war es moeglich nach einem Wort wie z.B.: Viagra zu suchen. Heute muss man alle moeglichen Varianten und Screibweissen unter Betracht ziehen und Regex und aehnliches ist sehr hilfreich aber letzlich dennoch zeitraubend und nach einigen Monaten ueberaltert.
Mein Vorschlag: Antispam sollte jede neue Mail als Spam ansehen und nicht als Ham. Der erste Prozess sollte alle Adressen in der Whitelist vergleichen und alle Mails von akzeptierbaren Sendern waere sofort gefunden und als Ham Mail eingestuft. Nun beginnt der grosse Unterschied. Momentan setzt eine Suche ein, die versucht Mails als Spam zu klassifizieren. Meiner Meinung nach waere es aber einfacher Mail als Ham einzustufen. Eine Web Seite koennte zum Beispiel sagen, dass das Wort: "Freund" in Betreff benutzt werden soll und dieser Hinweiss koennte zusammen mit mehreren E-mail Adressen aufgefuehrte werden. Kein Spammer wird sich die Muehe machen, um ein "Betreff Match" zu konstruieren. Ferner waere es moeglich weitere Kennwoerter hinzuzufuegen und diese Woerter koennten in normaler Schreibweise sein, da Ham Mail keine Tricks einbaut. Namen von Produkten (Vertrieb oder Herstellung), Bank, einige Geschaefte oder Versandhaeuser, Autoversicherung, Lebensversichering, Krankenversicherung, Sport usw. koennten dann zu jeder Zeit mehr al 98% mit absoluter Sicherheit klassifizieren und dies waere ermoeglicht mit Regeln, die praktisch nie korregiert werden muessen.
In meinem persoenlichen Fall habe ich zu Testzwecken eine solche Liste mit meinen Kennwoertern angelegt und Vergleiche angestellt. Nach rund zwei Wochen war diese Liste fertig und ich hatte genau 47 Kennwoerter zusaetzlich zu der Whiteliste und das Versuchsergebnis war nie unter 99% fuer eine Dauer von drei Monaten.
Dies ist m.E. ein Ueberlegung wert.
Klaus