ZitatDie Version, die ich runtergeladen habe, ist vom 31.05. 119.396 KB groß und der crc32 ist A0996e31. Ist das die neue?
Das ist nicht mehr die aktuelle, aber so viel hat sich nicht geändert. Ein neuerlicher Download ist nich unbedingt notwendig.
Betreffend der Abstürze beim Wechsel des Ordners kann ich vermutlich nichts machen. Ich denke auch nicht, dass das Plugin daran schuld ist.
ZitatEs handelt sich dabei um eine reine HTML-Mail ohne normalen Text. Wenn du eine solche reine HTML-Mail mit TB erzeugst, kannst du den gleichen Effekt wie oben beschrieben reproduzieren.
Alles klar.
ZitatGute Frage, vielleicht könnte man so was ja auch optionshalber machen. Ich würde auf jeden Fall einbauen, das reine Zahlen nicht als Wörter gelernt werden, genauso Nichtwörter wie "------".
In den Einstellungen ist es glaube ich ganz gut. Eine Wortliste oder so... mal sehen.
ZitatBei HTML-Mails würde ich vorschlagen Wörter zu ignorieren, die typisch sind also mit "<" anfangen und mit ">" aufhören. Vielleicht könnte man auch ganze Bereiche ignorieren wie <style.*</style>.
Das wäre dann der reine Text, wie ihn TB! bei "Nur-HTML" Nachrichten erstellt. Damit werde ich mich später befassen (s.h. unten).
ZitatBei den Grusskartenbenachrichtigungen von Web.de ist mir z.B. aufgefallen, daß Regula da Probleme mit hat.
Im neu erzeugten Datenbank stehen z.B. "iso-8859-1", "20haben", "20gru", "dfkarte", "20erhalten".Scheinbar wurden die Daten nur aus dem Subjekt genommen, da heißt es:
CODE
Subject: =?iso-8859-1?Q?Sie=20haben=20eine=20Gru=DFkarte=20erhalten.?=Bei der Grusskartenbenachrichtigung handelt es sich auch um eine reine HTML-Mail. Vielleicht könnte man da noch etwas nachbessern.
Der Betreff wird momentan noch im Original gelesen.
Im Moment arbeite ich gerade an einer Undo-Funktionalität für das Lernen. Da dies recht umfangreich ist - und direkt in den Bayes-Funktionen eingebunden ist, ist es besser, es gleich am Anfang zu erledigen. Danach werde ich mich mit den Daten beschäftigen (Subjekt dekodieren, HTML-Mails, Ausnahmen etc.). Zwischendurch werde ich aber immer versuchen, kleinere Features einzubauen oder auszubauen.