[Bug erledigt] Umlaute in Webseitenadressen

  • Ich habe einem Freund einen Link aus der Wikipedia über "Bläulinge" zugesandt: https://de.wikipedia.org/wiki/Bläulinge. So ist der Link auch als Text in meiner Mail zu lesen. Beim Anklicken des Links erscheint jedoch im Browser die Fehlermeldung, dass die Seite nicht existiert, weil TB! aus dem per Copy and Paste eingefügten Link im Hintergrund "https://de.wikipedia.org/wiki/BlÀulinge" macht. Ich hatte als Zeichensatz eigentlich die ganze Zeit "Westeuropäisch ISO" eingestellt, weil ich immer der Meinung war, UTF-8 braucht kein Mensch. Offenbar aber doch. Wenn ich UTF-8 nämlich vorher als Standardzeichensatz einstelle (geht wohl nur in den Kontoeigenschaften unter "Vorlagen - Neue Nachricht"), dann wird der anschließend eingefügte Link richtig gedeutet und aufgerufen.


    Woran liegt das? Ich benutze TB!, mein Freund andere e-Mailprogramme. Macht TB! da beim Erstellen der Nachricht Mist?

  • geht wohl nur in den Kontoeigenschaften unter "Vorlagen - Neue Nachricht"

    Man kann den Zeichensatz auch während des Verfassens einer Nachricht im Editor über die Statuszeile oder über "Optionen | Zeichensatz" ändern.



    Macht TB! da beim Erstellen der Nachricht Mist?

    Eventuell hängt's davon ab, was in den Kontoeigenschaften unter "Erweitert" und dann unten unter "Kodierung von Nicht-ASCII-Zeichen beim Versand" eingestellt ist. Mit "Quoted-Printable" beim Nachrichtentext hatte ich jetzt keine Probleme mit Umlauten in URLs bei einem Test. Diese Kodierung soll auch Internetstandard sein.

  • Die Website ist UTF-8 kodiert.
    Wenn du die URL in die Zwischenablage kopierst und in ein Mail mit ISO-8859-1 einfügst, wird eben aus dem ä ein À weil das ä bei UTF aus zwei Bytes besteht!
    Und den Link damit gibt es nicht.


    Das ist OK so.


    Benutze UTF-8 als Mailstandard, dann bist du auf der sicheren Seite.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Du ebenfalls?

    Nein, mit Text. Mit HTML kann ich das Problem bestätigen. Dafür braucht man die Nachricht nicht mal abzuschicken.


    Mit HTML funktioniert's bei mir übrigens auch mit UTF-8 nicht, wenn "Quoted-Printable" oder "Base64" eingestellt ist. Wenn ich aber "Keine" einstelle, dann geht's. Mit ISO-8859-1 geht's hingegen mit keiner Kodierung.


    Ich glaube, dass es daran liegt, dass die Umlaute bei "Quoted-Printable" falsch kodiert werden, wenn man HTML verwendet. Das o.g. Beispiel sieht dann so aus:

    Code
    https://de.wikipedia.org/wiki/Bl=C3=A4ulinge


    Müsste aber so aussehen:

    Code
    https://de.wikipedia.org/wiki/Bl=E4ulinge


    Bei einer Text-Nachricht wird hingegen richtig kodiert.


    Müsste also ein Bug sein.

  • Ok, danke für's Testen. Der HTML-Teil wurde ja jetzt im Bug-Tracker schon mehrfach mit allen möglichen Fehlern beanstandet. Vielleicht wird da demnächst mal gründlich aufgeräumt.

  • Ich glaube, dass es daran liegt, dass die Umlaute bei "Quoted-Printable" falsch kodiert werden


    Liegt doch daran. Ich habe es jetzt mit einem Quoted-printable Decoder/Encoder überprüft. Aus dem falsch kodierten

    Code
    https://de.wikipedia.org/wiki/Bl=C3=A4ulinge


    wird richtigerweise

    Code
    https://de.wikipedia.org/wiki/Bläulinge


    Da es eine solche Webseite nicht gibt, kommt eine Fehlermeldung im Browser.


    Am Zeichensatz liegt's also nicht.

  • Bitte melde den Bug mit HTML und dem Einfügen von URL aus der Zwischenablage an Ritlabs.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Ich glaube, ich habe das jetzt etwas mehr verstanden.


    Code
    https://de.wikipedia.org/wiki/Bl=C3=A4ulinge


    ist zwar auch eine richtige Kodierung, aber nur, wenn man UTF-8 wählt. Bei ISO-8859-1 muss es

    Code
    https://de.wikipedia.org/wiki/Bl=E4ulinge

    sein. TB! differenziert jedoch bei HTML-Mails nicht, sondern verwendet stets eine UTF-8 Methode. Hat man einen anderen Zeichensatz, hat man im Ergebnis eine falsche URL.


    Also hängt's doch auch mit dem eingestellten Zeichensatz zusammen. Im BT habe ich jedoch explizit ISO-8859-1 genannt.

  • Vielleicht ist denen die datenbak mal weider gecrasht.
    Aber #908 fehlt, stimmt.


    @sanyok Da musst du den Bug nochmals posten.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Die Entwickler können es nicht nachvollziehen und haben deswegen den BT-Eintrag geschlossen. Eine schöne Taktik. Vielleicht ist dort nicht Quoted-Printable eingestellt oder vielleicht liegt's nur am dt. OS. Wer weiß...


    Was machen wir jetzt? Soll ich den BT-Eintrag wiedereröffnen oder soll man das bei UTF-8 belassen, mit dem es klappt? Das soll wahrscheinlich Ralf entscheiden.

  • Die haben den einfach zugemacht :(
    Bitte weider öffnen.


    Mich stört's ja auch.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Ich habe mir zwar jetzt auch mit UTF-8 geholfen, aber der Fehler ist ja dadurch nicht behoben. Ich fände es eigentlich schon ganz gut, wenn da nochmal nachgeguckt würde. Also wieder aufmachen. Auch wenn das vielleicht nicht gerade höchste Priorität hat.