Hallo!
Die aktuell übliche Auswertung einzelner Wörter bei der Bayesprüfung ist ja bereits sehr wirksam, aber bei manchen Sorten JUNKs ist so nichts zu machen.
Selbst auf meinem Rechner mit 880-MHz-Prozessor geht die akuelle Bayesprüfung in Null Zeit. Die Bayes.wdb-Datei hat nur 3MB.
Wäre es nicht möglich, anstatt der einzelnen Wörter immer gleitend zwei, drei oder vier Wörter zusammenzufassen? Also nicht bei jedem Leerzeichen und Satzzeichen abzubrechen, sondern erst bei jedem zweiten, dritten oder vierten. Es könnte dann vielleicht auch noch sinnvol sein, wenn selbst Zeilenumbrüche im Quellcode oder eMailtext überbrükt würden.
Oder würde das die Grenzen der Computerleistung aus irgendeinem mathematischen Grund sprengen? :denk:
Gruß Hendrik