Aufteilung der Regel-Dateien

  • Hier sind ein paar regeln, die so fern all Varianten von Valium, Viagra usw. gefunden haben. Koennen im Subject or im Text benutxt werden.

    Habe ein kleines Anliegen fier den Developer von ASP.
    1. Program ist ausgezeichnet!
    2. Waere es moeglich, dass neue Aenderungen zu der existierenden Regeldatei in einer separaten Datei aufgefuehrt werden? Kopieren der neuen Datei loescht alle Veraenderungen bereits durchgefuehrt.

    Einmal editiert, zuletzt von Manu (26. Januar 2005 um 20:06)

  • Zitat

    2. Waere es moeglich, dass neue Aenderungen zu der existierenden Regeldatei in einer separaten Datei aufgefuehrt werden? Kopieren der neuen Datei loescht alle Veraenderungen bereits durchgefuehrt.


    Dafür ist eigentlich die RulesPriv gedacht.
    In diese kannst Du Deine "privaten" Regeln eintragen.

  • Zitat


    Dafür ist eigentlich die RulesPriv gedacht.
    In diese kannst Du Deine "privaten" Regeln eintragen.


    Danke.
    RulesPriv ist mir bekannt und RulesPriv enthaelt ungefaehr "300 Domain Rules" anstelle von mehr als 600 e-mail Adressen in der Whitelist. Ist schneller und viel einfacher was die Wartung anbelangt. Zusaetzlich, wenn ich eine Mail von einem Kunden erhalte, dessen Firma bereits gelistet ist, kommt diese Mail durch ohne Problem und ohne erneuten Eintrag.

    Rules.dat hatte mehrere Regeln, die ich entfernen (deaktivieren) oder veraendern muss. Kopieren einer neuen Datei erfordert den gleichen, erneuten Prozess.

  • @Klaus:
    Zu den regulären Ausdrücken: was stört dich an den Regeln

    Code
    SpamSubjText 90 SX " Viagra " [SUBJTEXT_BAD_WORD: Viagra]
    SpamSubjText 90 SX " Valium " [SUBJTEXT_BAD_WORD: Viagra]


    Wozu verwendest du die RegEx-Monster?

    Zur Regeldatei: Diese ist nur ein BEISPIEL. Auch auf die Gefahr hin, dass ich mich wiederhole: Die Rules.dat muss jeder überprüfen und für sich ändern. Die Datei RulesPriv.dat bedeutet nicht, dass nur hier oder gerade hier die "privaten" Regeln eingetragen müssen. Das ist nur ein beliebiger Dateinam, um zu demonstrieren, dass auch weitere Dateien eingebunden werden können. Ich habe Regeln zum Testen dort eingetragen, die nicht oder noch nicht in der Rules.dat stehen - darum "RulesPriv" - für mich privat. Diese Datei hat absolut keine Bedeutung für das Plugin und wird nur geladen, weil es in der Regeldatei - die wie erwähnt nur ein beispiel ist - drin steht.

  • Zitat

    RulesPriv ist mir bekannt und RulesPriv enthaelt ungefaehr "300 Domain Rules" anstelle von mehr als 600 e-mail Adressen in der Whitelist.


    Meinst du, dass da Regeln wie "FromAddr 0 SW "@nospam.net>" eingetragen sind?

    Wenn ja, wird dies in der nächsten Version auch in der Whitelist.txt möglich sein - z.B. "*@nospam.net" - wird alle Absendeadressen von der Domain nospam.net als HAM markieren.

  • Es ist mit Sicherheit ein grosser Vorteil fuer den Benutzer sowie fuer die "ASP Performance" wenn Eintragungen wie z.B. "*@nospam.net" in der Whitelist.txt moeglich sind. Ferner, waere es mit Sicherheit vorteilhaft, falls "Betreff" Werte als Whitelist Eintragungen benutzt werden koenten.

    Beispiel: Wir, und das gleiche trifft wahrscheinlich fuer andere Firmen zu, erlauben eine "Free Trial Version" runterzuladen und eine automatische E-mail wir von der Web Seite an uns gesandt. Es waere daher begruessenswert, "Free Trial Version" in Betreff as "0 SW" zu kennzeichnen.

    Die Regx-Monster haben mir in der Vegangenheit viel geholfen, aber wie ich heute festgestellt habe, faengt ASP bei weitem mehr ab als angenommen und ist eigentlich flexibler als es scheint.

    Wie angefragt, hier sind einige Regeln, die nicht benuzt werden koennen oder Veraenderungen erfordern:

    1. comcast.net
    Ist einer der groessten DSL Anbieter und hat Millionen von Kunden einschliesslich grosser Firmen, die mit einem comcast.net header versenden. Ich wuerde sagen, dass ungefaehr 98% von comcast.net e-mails keine Spam Mails sind.
    2. Aehnliches trifft fuer: swbell.net zu.
    3. Viele Firmen haben Kunden in Argentina und Brasilien. Daher ist es nicht gut Mails mit .BR oder .AR zu klassifizieren.
    4. Lotus header formattierung ist mir unbekannt, aber E-mail von Kunden, die Lotus installiert haben, wird als Spam ausgewiesen, da MessageID inkorrekt ist.
    5. 5 Zahlen sind nicht ungewoehnlich wenn ein Kunde eine Mail schicht und die Lizensnumber angibt.
    6. Zeitzone kann kein Bemessungswert sein fuer eine Firma die Kunden weltweit hat.
    7. Text mit Nummern ist nicht ungewoehnlich. z.b: AVG7, BitDefender8, Avast32
    8. Price und Purchase in Betreff mussen akzeptierbar sein, da u.U. ein Kunde einen Preis abfragen will.
    9. Viagra ist fuer mich IMMER Spam und sollte daher einen Wert von 100 haben und nicht 90, da 100 die Bemessungsgrenze ist.

    Hoffentlich ist die vorstehende Information ausreichend. Falls nicht, bitte lass mich wissen. ASP ist ein sehr gutes Program und ich habe es bereits an verschiedene Freunde weiterempfohlen.

    Klaus

  • Zitat

    Ferner, waere es mit Sicherheit vorteilhaft, falls "Betreff" Werte als Whitelist Eintragungen benutzt werden koenten.

    Beispiel: Wir, und das gleiche trifft wahrscheinlich fuer andere Firmen zu, erlauben eine "Free Trial Version" runterzuladen und eine automatische E-mail wir von der Web Seite an uns gesandt. Es waere daher begruessenswert, "Free Trial Version" in Betreff as "0 SW" zu kennzeichnen.

    Code
    Subj 0 SW S "Free Trial Version"
    Zitat

    Wie angefragt,

    Wer hat angefragt? Wo?

    Zitat

    1. comcast.net
    Ist einer der groessten DSL Anbieter und hat Millionen von Kunden einschliesslich grosser Firmen, die mit einem comcast.net header versenden. Ich wuerde sagen, dass ungefaehr 98% von comcast.net e-mails keine Spam Mails sind.
    2. Aehnliches trifft fuer: swbell.net zu.


    Lösche es raus. In Amerika wird man vermutlich mehr Mails von comcast.net bekommen. In Österreich kommt von comcast.net nur Spam.

    Zitat

    4. Lotus header formattierung ist mir unbekannt, aber E-mail von Kunden, die Lotus installiert haben, wird als Spam ausgewiesen, da MessageID inkorrekt ist.
    5. 5 Zahlen sind nicht ungewoehnlich wenn ein Kunde eine Mail schicht und die Lizensnumber angibt.
    6. Zeitzone kann kein Bemessungswert sein fuer eine Firma die Kunden weltweit hat.


    Lösche die Regeln eben raus.

    Zitat

    7. Text mit Nummern ist nicht ungewoehnlich. z.b: AVG7, BitDefender8, Avast32


    Wo ist diese Filterregel? Ich kenne nur jene Regel, die Zahlen zwichen zwei Buchstaben erkennt. Z.B. VI4GRA, aber nicht VIAGR4.

  • Ich muss hier Gaijin auch beipflichten.
    Die Änderungen von Version zu Version kann man ja leicht mit WinDiff, PSPad, TC etc... rausfinden.

    Die aufgeführten Modelle sind natürlich alle korrekt, werden wohl aber für die meisten - so schätze ich das ein - nicht zutreffen.
    Und selbst wenn doch - es ist ein auf Regel basierendes Plugin, bei welchem man die Regeln anpassen kann/muss.

  • Warum nicht folgender Vorschlag:

    In die Regel-Datei kommen nur Filter die keine Probleme machen (mangelhafte Regeln über Rückmeldung durch Anwender).
    Spezielle Filter die evtl. Fehltreffer produzieren liegen in einer zusätzlichen Datei bei die der Anwender dann in seine User-Filter-Datei mit reinkopieren kann wenn er möchte.

    Somit wären alle bisher bekannten Filter im Programm dabei und der Anwender kann selbst entscheiden ob er die Zusatzfilter verwenden möchte.

    So müsste der Anwender auch nicht jedesmal die Filterregel-Datei neu anpassen wenn etwas falsch aussortiert wird und kann bei nem Update einfach die aktuelle Regeldatei einspielen.

    ...is aber nur so ne Idee...

  • Und noch einmal: [size=1]Rules.dat = BEISPIEL[/size] oder, um auch den englischsprachigen Besuchern dieses Boards gerecht zu werden, [size=1]Rules.dat = SAMPLE[/size], ich hoffe, dass diesmal keine grammatikalischen Fehler enthalten sind. :lol:

    Mit diesem Thema habe ich, wenngleich auch offensichtlich erfolglos, versucht, andere Benutzer von ASP dazu zu bewegen ihre eigenen Regeln (NUR) für ASP zu posten - natürlich auch optimierte oder für sie angepasse Regeln.

    Wenn man jetzt mal von "Rules.dat = Beispiel" absieht, hat Bernd's Idee schon gewisse Ähnlichkeiten mit meinem Vorschlag:

      [li]Rules.dat ist und bleit ein BEISPIEL :D [/li][li]Die Regeln in Gruppen oder Kategorien unterteilen - wie etwa HTML-Formatierung, Bad Words, Phishing, gefälsche Headerdaten, oder auch nach Kampagnen wie "Rolex-Spam", "Software Werbung" oder "Nigeria-Spam".[/li]

  • Zu Deiner Frage: Wer und wann wurde etwas angefragt. Am 26.01 hast Du in einer Nachricht an mich gefragt: " Zu den regulären Ausdrücken: was stört dich an den Regeln?" Um diese Frage zu beantworten, habe ich zehn Beispiele aufgelistet. Offensichtlich, magst Du aber nicht wenn etwas wie eine Kritik aussieht. Tut mir leid wenn Dir die Antwort nicht gefallen hat.

    Ich finde folgendes ziemlich aggressive:
    "Und noch einmal: Rules.dat = BEISPIEL oder, um auch den englischsprachigen Besuchern dieses Boards gerecht zu werden, Rules.dat = SAMPLE, ich hoffe, dass diesmal keine grammatikalischen Fehler enthalten sind."

    "Englischsprachige Besucher" ist sicherlich auf mich bezogen und der Hinweiss, dass diesmal keine grammatikalischen Fehler enthalten sind ist wahrscheinlich fuer Manu. Du solltest froh sein, dass hier einige Anregungen ausdiskutiert werden. Ich habe in den letzten 20 Jahren sehr viel von Kundenkritiken gelernt und meine Programme sind dadurch viel, viel besser geworden. Ich habe Kunden in nahezu 80 Laendern und meine Programme liegen zwischen 3.000 und 25.000 US Dollar. Ich habe gelernt zuzuhoeren und Anregungen anzunehmen. Zugegeben, hin und wieder war ich veraergert aber ich habe dies niemals zum Ausdruck gebracht und ein Satz wie z.B.: "Und noch einmal: Rules.dat = BEISPIEL ..." sagt uns allen, dass wir praktisch dorthin gehen koennen/ sollen wo der Pfeffer waechst.

    Klaus

  • Zitat

    Zu Deiner Frage: Wer und wann wurde etwas angefragt. Am 26.01 hast Du in einer Nachricht an mich gefragt: " Zu den regulären Ausdrücken: was stört dich an den Regeln?" Um diese Frage zu beantworten, habe ich zehn Beispiele aufgelistet.


    Damit meinte ich die langen regulären Ausdrücke, die mit den von mir geposteten Regeln (Option "X") einfacher ausgedrückt werden können.

    Zitat

    Offensichtlich, magst Du aber nicht wenn etwas wie eine Kritik aussieht. Tut mir leid wenn Dir die Antwort nicht gefallen hat.

    Kritik mag ich schon, aber nur wenn auch ein Lösungsvorschlag dabei ist.

    Zitat

    Ich finde folgendes ziemlich aggressive:

    Finde ich nicht, jedenfalls sollte man beim Zitieren auch die Smilies mitzitieren - es war lustig gemeint.

    Zitat

    und der Hinweiss, dass diesmal keine grammatikalischen Fehler enthalten sind ist wahrscheinlich fuer Manu.

    Nein, das war auf mich bezogen (betr. deiner E-Mail).

  • Zitat:
    "Kritik mag ich schon, aber nur wenn auch ein Lösungsvorschlag dabei ist."

    Ok. Moechte einen Vorschlag ohne Kritik unterbreiten und diesen zur Diskussion anbieten. Ich werde zu diesem Zweck ein neues Thema (Warum Nicht So...?) waehlen, da hoffentlich viele Meinungen abgegeben werden.

    Klaus