Regula Plugin 1.1.9 BETA

  • Zitat

    Die Version, die ich runtergeladen habe, ist vom 31.05. 119.396 KB groß und der crc32 ist A0996e31. Ist das die neue?


    Das ist nicht mehr die aktuelle, aber so viel hat sich nicht geändert. Ein neuerlicher Download ist nich unbedingt notwendig.

    Betreffend der Abstürze beim Wechsel des Ordners kann ich vermutlich nichts machen. Ich denke auch nicht, dass das Plugin daran schuld ist.

    Zitat

    Es handelt sich dabei um eine reine HTML-Mail ohne normalen Text. Wenn du eine solche reine HTML-Mail mit TB erzeugst, kannst du den gleichen Effekt wie oben beschrieben reproduzieren.


    Alles klar.

    Zitat

    Gute Frage, vielleicht könnte man so was ja auch optionshalber machen. Ich würde auf jeden Fall einbauen, das reine Zahlen nicht als Wörter gelernt werden, genauso Nichtwörter wie "------".


    In den Einstellungen ist es glaube ich ganz gut. Eine Wortliste oder so... mal sehen.

    Zitat

    Bei HTML-Mails würde ich vorschlagen Wörter zu ignorieren, die typisch sind also mit "<" anfangen und mit ">" aufhören. Vielleicht könnte man auch ganze Bereiche ignorieren wie <style.*</style>.


    Das wäre dann der reine Text, wie ihn TB! bei "Nur-HTML" Nachrichten erstellt. Damit werde ich mich später befassen (s.h. unten).

    Zitat

    Bei den Grusskartenbenachrichtigungen von Web.de ist mir z.B. aufgefallen, daß Regula da Probleme mit hat.
    Im neu erzeugten Datenbank stehen z.B. "iso-8859-1", "20haben", "20gru", "dfkarte", "20erhalten".

    Scheinbar wurden die Daten nur aus dem Subjekt genommen, da heißt es:
    CODE
    Subject: =?iso-8859-1?Q?Sie=20haben=20eine=20Gru=DFkarte=20erhalten.?=

    Bei der Grusskartenbenachrichtigung handelt es sich auch um eine reine HTML-Mail. Vielleicht könnte man da noch etwas nachbessern.


    Der Betreff wird momentan noch im Original gelesen.

    Im Moment arbeite ich gerade an einer Undo-Funktionalität für das Lernen. Da dies recht umfangreich ist - und direkt in den Bayes-Funktionen eingebunden ist, ist es besser, es gleich am Anfang zu erledigen. Danach werde ich mich mit den Daten beschäftigen (Subjekt dekodieren, HTML-Mails, Ausnahmen etc.). Zwischendurch werde ich aber immer versuchen, kleinere Features einzubauen oder auszubauen.

  • Zitat

    Betreffend der Abstürze beim Wechsel des Ordners kann ich vermutlich nichts machen. Ich denke auch nicht, dass das Plugin daran schuld ist.


    Wie gehen denn die anderen Plug-Ins damit um? Bei denen müßte ja derselbe Absturz auch kommen, falls sie TB nicht für den User sperren.

    Zitat

    Im Moment arbeite ich gerade an einer Undo-Funktionalität für das Lernen. Da dies recht umfangreich ist - und direkt in den Bayes-Funktionen eingebunden ist, ist es besser, es gleich am Anfang zu erledigen. Danach werde ich mich mit den Daten beschäftigen (Subjekt dekodieren, HTML-Mails, Ausnahmen etc.). Zwischendurch werde ich aber immer versuchen, kleinere Features einzubauen oder auszubauen.


    Das hört sich nach 'ner Menge Arbeit an, freu mich schon auf die nächste Version! :)

  • Unter http://members.aon.at/gaijin/gaijinat/regula119b.rar habe ich die aktuelle Version hochgeladen (derzeit ohne Hilfe-Datei).

    Aktuelle Änderungen:

    [+] Undo-Funktion für Bayes-Filter. Die Datei "Bayes.wdb' sollte vorher gelöscht und neu trainiert werden, damit die Daten auch in der Undo-Datenbank übereinstimmen. Das Aufräumen der Bayes-Datenbank (im Regula Manager) setzt auch die Undo-Datenbank zurück.

    [*] Der Betreff wird jetzt dekodiert.

    [-] Ein Fehler beim Lesen von "Nur-Text" und "Nur-HTML" Nachrichten wurde behoben.

    [+] Im Regula Manager kann die Protokolldatei und die damit verbundene Statistik neu geladen werden.

    [-] Im Regula Manager wurden diverse Fehler behoben, die auftraten, wenn keine Bayes-Datenbank vorhanden war.

    Anmerkung zum Regula Manager:
    Am Punkt "Statistik" > "Prüfungsübersicht" wird noch gearbeitet und ist daher noch unvollständig. Auch andere Bereiche werden noch geändert...


    [size=1]UPDATE[/size] (05.06.2005, 13.05 Uhr)

    [+] Bestimmte Wörter können von der Bayes-Prüfung und von der Aufnahme in der Datenbank ausgenommen werden (ExceptedWords.txt).

    [+] Im Regula Manager kann die Datei "ExceptedWords.txt" unter "Listeneditor" bearbeitet werden.

    [*] Regula Manager: In der Regel-Statistik wird die interne Regel "BayesScore" nicht mehr angeführt.

    [*] Regula Manager: Die Übersicht ("Statistik" > "Übersicht") wurde verbessert.