[ANN] txt2html.regexps

  • Werbung auf der TBOT bei mail4free-Mailingliste ausblenden.

    Code
    (?s)((<BR>\s*)+\-{3}\<BR\>\s+Werbung\:.*\-{3}<BR>)=<BR><BR>
    (?s)(<BR>\s*ml4free.*info@ml4free.de</A><BR>\s+\<BR\>\<\/ADDRESS\>)=

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

    Einmal editiert, zuletzt von beta (23. Mai 2006 um 17:25)

  • Zitat


    Werbung auf der TBOT bei mail4free-Mailingliste ausblenden.

    Code
    (?s)((<BR>\s*)+\-{3}\<BR\>\s+Werbung\:.*\-{3}<BR>)=<BR><BR>
    (?s)(<BR>\s*ml4free.*info@ml4free.de</A><BR>\s+\<BR\>\<\/ADDRESS\>)=

    Sehr schön :punk:

    Aber was auf OT (noch 3 Gruppen) im Moment abläuft, finde ich :thumbdown:
    Dank TheBat nur zwei Ordner und entsprechende Filter einrichten, fertig ist die Sache :ph34r:

  • Zitat


    Werbung auf der TBOT bei mail4free-Mailingliste ausblenden.

    Code
    (?s)((<BR>\s*)+\-{3}\<BR\>\s+Werbung\:.*\-{3}<BR>)=<BR><BR>
    (?s)(<BR>\s*ml4free.*info@ml4free.de</A><BR>\s+\<BR\>\<\/ADDRESS\>)=

    Kleines Update für Freunde des schmalen Fusses:

    Code
    (?mis)(\n?(<BR>[^0-9a-z]*)+\-{3}\<BR\>\s+Werbung\:.*\-{3}<BR>)=<BR><BR>

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Welche Pics? Done!

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

    Einmal editiert, zuletzt von beta (26. Mai 2006 um 11:23)

  • Jetzt hab ich das mal in Benutzung.
    Und nen "Bug" gefunden.

    aus

    Code
    http://www.feurio.de/shop/shop_uebersicht_dvd-rw_minidvdrw.html


    macht es mir

    Code
    http://www.feurio.de/shop/shop<U>_uebersicht_</U>dvd-rw_minidvdrw.html

    Somit funktioniert der Link nicht mehr.
    Kann man URLs denn von der Bearbeitung/Dekodierung ausschliessen?

  • Zitat


    Bekannte Probleme

    - Fehldarstellung vom HTML-EMail (besonders, die mit The Bat! erzeugt wurden)
    - "gestylte" Texte am Zeilenanfang werden nicht interpretiert, hier gabs es mit meinem Regex Probleme mit Internetadressen

    Code
    ?:[\s"']*)(\/)([äöüßÄÖÜa-zA-Z0-9^$\^\$\:\;\,\\]+)(\/)=\1<em>\2</em>\3

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Problem ist folgendes: Das RegExp unterscheidet nicht in den Internetadressen bzw. Links.

    Lösche mal die Zeile in deiner Datei, die mit [glow=red,2,300]=<U>_\3_</U>[/glow] endet und ersetze sie mit folgender Zeile:

    Code
    (?s)(\s+|^|\<BR\>)(_((\w|_[^_])+)_)([?!.,;]|\s+|\<\br\>)=<U>_\3_</U>

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

    Einmal editiert, zuletzt von beta (27. Mai 2006 um 13:12)

  • Code
    (\<STYLE type.\"text\/css\"\>)=\1 span.onpx{font-size:1px;color:white}
    (?i)((?<![a-z\d\<\:])\*(?![\s\*]|[\_\/]\s)(.*?[a-z\d].*?)(?<![\<\:\*\s])\*(?![a-z\d\"\>]))=<span class="onpx">*</span><b>\2</b><span class="onpx">*</span>
    (?i)((?<![a-z\d\<\:])\_(?![\s\_]|[\*\_]\s)(.*?[a-z\d].*?)(?<![\<\:\_\s])\_(?![a-z\d\"\>]))=<span class="onpx">_</span><u>\2</u><span class="onpx">_</span>
    (?i)((?<![a-z\d\<\:\/])\/(?![\s\/]|[\*\/]\s).*?[a-z\d].*?(?<![\<\:\/\s])\/(?![a-z\d\"\>]))=<i>\1</i>

    … hat jemand in der TB-USER-EN gepostet. Rockt für die Anzeige von von formatierten Text.

    BTW: Ließ jemand noch in der englischen OT mit?

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Zitat
    Code
    (\<STYLE type.\"text\/css\"\>)=\1 span.onpx{font-size:1px;color:white}
    (?i)((?<![a-z\d\<\:])\*(?![\s\*]|[\_\/]\s)(.*?[a-z\d].*?)(?<![\<\:\*\s])\*(?![a-z\d\"\>]))=<span class="onpx">*</span><b>\2</b><span class="onpx">*</span>
    (?i)((?<![a-z\d\<\:])\_(?![\s\_]|[\*\_]\s)(.*?[a-z\d].*?)(?<![\<\:\_\s])\_(?![a-z\d\"\>]))=<span class="onpx">_</span><u>\2</u><span class="onpx">_</span>
    (?i)((?<![a-z\d\<\:\/])\/(?![\s\/]|[\*\/]\s).*?[a-z\d].*?(?<![\<\:\/\s])\/(?![a-z\d\"\>]))=<i>\1</i>


    … hat jemand in der TB-USER-EN gepostet. Rockt für die Anzeige von von formatierten Text.

    Soll der Vierzeiler wieder alles in eine Zeile oder?

    Einmal editiert, zuletzt von Bernd (7. Oktober 2006 um 16:28)

  • In der OT-Liste (Charlie) habe ich heute einen Beitrag von Stefan Aubke mid:702472036.20061007131118@telecomweb.de bekommen, wo das Textfeld leer war. Solche eMails kommen mir zur Zeit öfters unter. Lesbar sind Diese dann nur, wenn ich die Kopfzeilen einschalte.

    Jetzt bin ich dahinter gekommen, dass es an folgender Zeile 24 in der txt2html.regexps liegt:

    Code
    (?:[^\s"']*)-([\w\+/\.\:\\_']*)-(?:\s)=-<STRIKE>\1</STRIKE>-

    Woran liegt das? Und wie muss ich obige Zeile so abändern, dass ich die Nachricht wieder normal lesen kann? Von regex habe ich leider keine Ahnung.
    Danke.

  • Code
    (\<STYLE type.\"text\/css\"\>)=\1 span.onpx{font-size:1px;color:white}
    (?i)((?<![a-zäöüß\d\<\:\/])\/(?![\s\/]|[\*\_]\s)([^\/\n]*?[a-zäöüß\d][^\/\n]*?)(?<![\<\:\/\s])\/(?![a-zäöüß\d\"\>]))=<span class="onpx">/</span><i>\2</i><span class="onpx">/</span>
    (?i)((?<![a-zäöüß\d\<\:\/])\/(?![\s\/]|[\*\_]\s)([^\/\n]*?[a-zäöüß\d][^\/\n]*?)(?<![\<\:\/\s])\/(?![a-zäöüß\d\"\>]))=<i>\1</i>
    (?i)((?<![a-zäöüß\d\<\:])\*(?![\s\*]|[\_\/]\s)([^\*\n]*?[a-zäöüß\d][^\*\n]*?)(?<![\<\:\*\s])\*(?![a-zäöüß\d\"\>]))=<span class="onpx">*</span><b>\2</b><span class="onpx">*</span>
    (?i)((?<![a-zäöüß\d\<\:])\_(?![\s\_]|[\*\/]\s)([^\_\n]*?[a-zäöüß\d][^\_\n]*?)(?<![\<\:\_\s])\_(?![a-zäöüß\d\"\>]))=<span class="onpx">_</span><u>\2</u><span class="onpx">_</span>
    (?i)((?<!([a-zäöüß\d]|\<|\:))\#(?![\s\#])(.+?)(?<![\s\#])\#(?![a-zäöüß\d\"\>]))=<span class="onpx">#</span><strike>\3</strike><span class="onpx">#</span>

    Das ist der aktuelle Code für fett, kursiv, unterstrichen.

    Das ersetzt unteranderem folgende Zeilen:

    @vetdoc: Man müßte mal die Nachricht sehen.

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

  • Mit dem neuen Code klappt es wieder. Danke für die schnelle Hilfe.

    Zitat

    @vetdoc: Man müßte mal die Nachricht sehen.

    Bitte schön:

    Zitat

    ,----- [ ]
    | Eine schöne Geschichte über den Herrn Müller.
    |
    `-----
    --

    Bis dann,
    Stephan


    Anm: Der Textinhalt gibt nicht unbedingt meine Meinung/Einstellung wieder.
    Änderung: Habe den Text komplett entfernt

    MOD: Ich habe den Text mal entfernt, damit wir hier einer Abmahnung aus den Weg gehen.

    Kannst Du eventl. auch die Datei auf Tommys Server aktualisieren?
    http://thebatworld.de/pandorasbox/txt2html/txt2html.regexps
    Dann haben alle etwas davon.
    :thumbup: :thx:

    Einmal editiert, zuletzt von m_vetdoc (8. Oktober 2006 um 20:43)

  • Der Text nützt nix. Da braucht man immer den Text im MBOX-Format um zu sehen wie The Bat! den Text parst.

    Man möchte manchmal Kannibale sein, nicht um den oder jenen aufzufressen, sondern um ihn auszukotzen. Johann Nestroy.

    Einmal editiert, zuletzt von beta (8. Oktober 2006 um 19:36)

  • Zitat

    MOD: Ich habe den Text mal entfernt, damit wir hier einer Abmahnung aus den Weg gehen.

    Sorry, hab ich nicht bedacht.

    Zitat

    Der Text nützt nix. Da braucht man immer den Text im MBOX-Format um zu sehen wie The Bat! den Text parst.

    Bitte sehr.

  • Hi all,

    ich hab das mal ausprobiert, habe aber das Problem, dass er Kommentare in "Sternchen" nicht fett darstellt. Es werden nur die Sternchen gelöscht, der Text bleibt aber unformatiert. Kann es sein, dass mir da ein Font fehlt? Den ProFontWindows habe ich installiert.

    Nutze aktuelle TB-Version unter Windows Vista.

    Edit: Wenn ich in den Einstellungen bei RTF-Betrachter von Courier New auf den ProFontWindows - Font umstelle geht es, ist das so gewollt?

    Edit 2: Es geht bei allen Fonts, nur nicht bei dem voreingestellten Courier New.

    Frank

    Einmal editiert, zuletzt von high55555 (6. Februar 2007 um 11:34)