[Bug erledigt] Umlaute in Webseitenadressen

Ralf Brinkmann

Ich habe einem Freund einen Link aus der Wikipedia über "Bläulinge" zugesandt: https://de.wikipedia.org/wiki/Bläulinge. So ist der Link auch als Text in meiner Mail zu lesen. Beim Anklicken des Links erscheint jedoch im Browser die Fehlermeldung, dass die Seite nicht existiert, weil TB! aus dem per Copy and Paste eingefügten Link im Hintergrund "https://de.wikipedia.org/wiki/BlÃ€ulinge" macht. Ich hatte als Zeichensatz eigentlich die ganze Zeit "Westeuropäisch ISO" eingestellt, weil ich immer der Meinung war, UTF-8 braucht kein Mensch. Offenbar aber doch. Wenn ich UTF-8 nämlich vorher als Standardzeichensatz einstelle (geht wohl nur in den Kontoeigenschaften unter "Vorlagen - Neue Nachricht"), dann wird der anschließend eingefügte Link richtig gedeutet und aufgerufen.

Woran liegt das? Ich benutze TB!, mein Freund andere e-Mailprogramme. Macht TB! da beim Erstellen der Nachricht Mist?

**sanyok**

Zitat von Ralf Brinkmann

geht wohl nur in den Kontoeigenschaften unter "Vorlagen - Neue Nachricht"

Man kann den Zeichensatz auch während des Verfassens einer Nachricht im Editor über die Statuszeile oder über "Optionen | Zeichensatz" ändern.

Zitat von Ralf Brinkmann

Macht TB! da beim Erstellen der Nachricht Mist?

Eventuell hängt's davon ab, was in den Kontoeigenschaften unter "Erweitert" und dann unten unter "Kodierung von Nicht-ASCII-Zeichen beim Versand" eingestellt ist. Mit "Quoted-Printable" beim Nachrichtentext hatte ich jetzt keine Probleme mit Umlauten in URLs bei einem Test. Diese Kodierung soll auch Internetstandard sein.

Ralf Brinkmann

Ich habe da ebenfalls Quoted Printable eingestellt.. Vielleicht sollte ich noch dazu sagen, dass ich die Nachricht im HTML-Format erstellt habe. Du ebenfalls?

**GwenDragon**

Die Website ist UTF-8 kodiert.
Wenn du die URL in die Zwischenablage kopierst und in ein Mail mit ISO-8859-1 einfügst, wird eben aus dem ä ein Ã€ weil das ä bei UTF aus zwei Bytes besteht!
Und den Link damit gibt es nicht.

Das ist OK so.

Benutze UTF-8 als Mailstandard, dann bist du auf der sicheren Seite.

Ralf Brinkmann

Alles klar.

**sanyok**

Zitat von Ralf Brinkmann

Du ebenfalls?

Nein, mit Text. Mit HTML kann ich das Problem bestätigen. Dafür braucht man die Nachricht nicht mal abzuschicken.

Mit HTML funktioniert's bei mir übrigens auch mit UTF-8 nicht, wenn "Quoted-Printable" oder "Base64" eingestellt ist. Wenn ich aber "Keine" einstelle, dann geht's. Mit ISO-8859-1 geht's hingegen mit keiner Kodierung.

Ich glaube, dass es daran liegt, dass die Umlaute bei "Quoted-Printable" falsch kodiert werden, wenn man HTML verwendet. Das o.g. Beispiel sieht dann so aus:

Code

https://de.wikipedia.org/wiki/Bl=C3=A4ulinge

Müsste aber so aussehen:

Code

https://de.wikipedia.org/wiki/Bl=E4ulinge

Bei einer Text-Nachricht wird hingegen richtig kodiert.

Müsste also ein Bug sein.

Ralf Brinkmann

Ok, danke für's Testen. Der HTML-Teil wurde ja jetzt im Bug-Tracker schon mehrfach mit allen möglichen Fehlern beanstandet. Vielleicht wird da demnächst mal gründlich aufgeräumt.

**sanyok**

Zitat von sanyok

Ich glaube, dass es daran liegt, dass die Umlaute bei "Quoted-Printable" falsch kodiert werden

Liegt doch daran. Ich habe es jetzt mit einem Quoted-printable Decoder/Encoder überprüft. Aus dem falsch kodierten

Code

https://de.wikipedia.org/wiki/Bl=C3=A4ulinge

wird richtigerweise

Code

https://de.wikipedia.org/wiki/BlÃ¤ulinge

Da es eine solche Webseite nicht gibt, kommt eine Fehlermeldung im Browser.

Am Zeichensatz liegt's also nicht.

**GwenDragon**

Bitte melde den Bug mit HTML und dem Einfügen von URL aus der Zwischenablage an Ritlabs.

**sanyok**

Habe einen BT-Eintrag erstellt ~~"#0000908: Umlauts in URLs are encoded wrong with Quoted-Printable in HTML messages"~~.

//MODEDIT: Ist jetzt #0000909

**GwenDragon**

Bug bestätigt und Testmail dort hochgeladen.

**sanyok**

Ich glaube, ich habe das jetzt etwas mehr verstanden.

Code

https://de.wikipedia.org/wiki/Bl=C3=A4ulinge

ist zwar auch eine richtige Kodierung, aber nur, wenn man UTF-8 wählt. Bei ISO-8859-1 muss es

Code

https://de.wikipedia.org/wiki/Bl=E4ulinge

sein. TB! differenziert jedoch bei HTML-Mails nicht, sondern verwendet stets eine UTF-8 Methode. Hat man einen anderen Zeichensatz, hat man im Ergebnis eine falsche URL.

Also hängt's doch auch mit dem eingestellten Zeichensatz zusammen. Im BT habe ich jedoch explizit ISO-8859-1 genannt.

Ralf Brinkmann

Danke fürs Bug-Report erstellen. Habe das Problem dort bestätigt und außerdem gemäß Gwens Empfehlung meine Codierung auf UTF-8 umgestellt.

**sanyok**

Zitat von sanyok

Habe einen BT-Eintrag erstellt "#0000908: Umlauts in URLs are encoded wrong with Quoted-Printable in HTML messages".

Kann es sein, dass dieser Eintrag aus dem BT entfernt wurde? Oder bekomme nur ich den Fehler "Eintrag 908 nicht gefunden"?

Ralf Brinkmann

Ich kann ihn auch nicht finden. Ich hatte in den letzten Tagen auch vereinzelt Probleme, die Seite überhaupt zu erreichen.

**GwenDragon**

Vielleicht ist denen die datenbak mal weider gecrasht.
Aber #908 fehlt, stimmt.

@sanyok Da musst du den Bug nochmals posten.

**sanyok**

Da die Nr. 908 in der Zwischenzeit wohl freigegeben wurde und jetzt besetzt ist, habe ich den Bug erneut als #0000909 eingetragen. Also bitte nochmals bestätigen. Mal sehen, ob dieser bleibt.

**sanyok**

Die Entwickler können es nicht nachvollziehen und haben deswegen den BT-Eintrag geschlossen. Eine schöne Taktik. Vielleicht ist dort nicht Quoted-Printable eingestellt oder vielleicht liegt's nur am dt. OS. Wer weiß...

Was machen wir jetzt? Soll ich den BT-Eintrag wiedereröffnen oder soll man das bei UTF-8 belassen, mit dem es klappt? Das soll wahrscheinlich Ralf entscheiden.

**GwenDragon**

Die haben den einfach zugemacht
Bitte weider öffnen.

Mich stört's ja auch.

Ralf Brinkmann

Ich habe mir zwar jetzt auch mit UTF-8 geholfen, aber der Fehler ist ja dadurch nicht behoben. Ich fände es eigentlich schon ganz gut, wenn da nochmal nachgeguckt würde. Also wieder aufmachen. Auch wenn das vielleicht nicht gerade höchste Priorität hat.

Tags