[Bug erledigt] Umlaute in Webseitenadressen

  • Ich hab's wiedereröffnet und dabei fiel mir auf, dass der Bug auch mit UTF-8 nachvollziehbar ist. Dafür darf man die ULR nicht per [STRG]+[V] einfügen, sondern muss das über "Hyperlink einfügen" machen. Ich habe die URL in einer HTML-Mail extra zweimal eingefügt: per Copy'n'Paste und per Icon. Der erste Link funktionierte später, während beim zweiten auf der Wiki-Seite "Der angeforderte Seitentitel enthält eine ungültige UTF-8-Sequenz" stand.

    Im Quelltext war der erste Link richtig mit

    Code
    https://de.wikipedia.org/wiki/Bl=C3=A4ulinge


    kodiert. Der zweite wurde aber so kodiert:

    Code
    https://de.wikipedia.org/wiki/Bl=EF=BF=BDulinge


    Das ergibt später natürlich einen anderen Buchstaben statt "ä".

  • Wie ist es eigentlich bei euch mit UTF-8 und "Hyperlink einfügen" (s.o.)? Funktioniert der Link danach? Wenn nicht, dann betrifft das Problem nicht nur ISO-8859-1. Wenigstens das mit UTF-8 müssten die Entwickler nachvollziehen.

    Hallo Sanyok,

    gerade getestet (nutze sonst weder HTML und QP zum Verfassen)
    Link: https://de.wikipedia.org/wiki/Blümchenkaffee
    Im Textteil korrekt,
    im HTML Teil korrekt

    im Quelltext fehlerhaft:
    <html><head><title>Test UTF-8 HTML QP</title>
    </head>
    <body>
    <a style=3D" font-family:'Tahoma'; font-size: 10pt;" href=3D"https://de.wik=
    http://ipedia.org/wiki/Bl=C3=BCmchenkaffee">https://de.wikipedia.org/wiki/Blü=
    mchenkaffee</a> <br>
    <br>
    </body></html

    Nachtrag Test ohne Quoted Printable und mit Hyperlink einfügen bei HTML und Text Mail:
    <html><head><title>Test UTF-8</title>
    </head>
    <body>
    <span style=" font-family:'Tahoma'; font-size: 10pt;">Hallo Marina<br>
    <br>

    </span><a style=" font-family:'tahoma'; font-size: 10pt;" href="https://de.wikipedia.org/wiki/Blmchenkaffee">https://de.wikipedia.org/wiki/Blümchenkaffee</a> </body></html>

    Aber nur im Quelltext. Im Nachrichtenfenster ist der Link korrekt, sowohl im Text als auch im HtML Teil!
    Spezielle Vorlagen für HTML habe ich nicht, da ich es sonst nicht nutze...


    Bye

    Marina

  • Aber nur im Quelltext. Im Nachrichtenfenster ist der Link korrekt, sowohl im Text als auch im HtML Teil!


    Im Nachrichtentext selbst werden die Umlaute bei allen Benutzern richtig angezeigt. Wenn man jedoch auf den Link klickt, kommt man auf eine nicht existente Webseite, weil die URL falsch ist, wiederum weil die Umlaute darin falsch dekodiert werden, wiederum weil sie seinerzeit falsch kodiert wurden. Entscheidend ist daher, was im Quelltext unter A HREF steht.

    Wenn du es so machst, wie ich oben beschrieben habe, und später auf deinen Link klickst, landest du dann auch tatsächlich auf der Blümchenkaffee-Webseite? Bei mir z.B. zeigt Wiki an:

    Code
    Ungültiger Titel
    
    
    Der angeforderte Seitentitel enthält eine ungültige UTF-8-Sequenz. 
    
    
    Zurück zur Seite Wikipedia:Hauptseite.
  • Im Nachrichtentext selbst werden die Umlaute bei allen Benutzern richtig angezeigt. Wenn man jedoch auf den Link klickt, kommt man auf eine nicht existente Webseite, weil die URL falsch ist, wiederum weil die Umlaute darin falsch dekodiert werden, wiederum weil sie seinerzeit falsch kodiert wurden. Entscheidend ist daher, was im Quelltext unter A HREF steht.

    Wenn du es so machst, wie ich oben beschrieben habe, und später auf deinen Link klickst, landest du dann auch tatsächlich auf der Blümchenkaffee-Webseite? Bei mir z.B. zeigt Wiki an:

    Code
    Ungültiger Titel
    
    
    Der angeforderte Seitentitel enthält eine ungültige UTF-8-Sequenz. 
    
    
    Zurück zur Seite Wikipedia:Hauptseite.

    Hallo Sanyok,

    Bei allen 3 Versuchen bei mir ist es nur der letzte Versuch (Bild "TB!_HTML-Text_UTF-8_ohneQPTest.jpg")
    der zu einem ungültigen Aufruf führt...

    dann kommt die Meldung oben. Blmchenkaffee ohne Umlaut.

    und zwar nur wenn ohne QP und nur im HTML Teil. Im Nur-Text Modus funktioniert der Link.

    Und das Test-Mail mit UTF-8 und HTML/Text Format mit Quoted Printable sind sowohl im Text als auch im HTML Teil die Links anklickbar!


    Und zwar sowohl mit Copy/Paste als auch per Symbol Hyperlink.

    Allerdings beim letzteren nur, wenn der Link aus der Adresszeile des Browsers (hier Opera 12.18) kopiert und per Symbol eingefügt wird.

    Habe also als zweiten Browser Vivaldi am Laufen, weil Batboard unter dem alten Opera nicht richtig funktioniert.

    Also ein bisschen hin und her, und das mit nur 2GB RAM (maximale Grösse)

    Hoffentlich hilft es weiter!
    Mal sehen, ob Vivaldi beim Abschicken hier den "Quellcode" in Ruhe lässt. Offenbar hat es beim letzten Beitrag eine automatische Korrektur durch Vivaldi gegeben, deshalb dann auch der zweite Screenshot.
    Gute Idee, über Code Symbol. War mir bislang noch nicht bekannt, da ich diese Möglichkeit übersehen hatte.

    Nix für ungut!

    Marina

  • Allerdings beim letzteren nur, wenn der Link aus der Adresszeile des Browsers (hier Opera 12.18) kopiert und per Symbol eingefügt wird.

    Ich habe jetzt weitere Tests durchgeführt und es kann durchaus auch am Browser liegen. Bei meinen Tests habe ich die URL aus der URL bar des jeweiligen Browsers kopiert und in TB! über "Hyperlink einfügen" eingefügt. Die kopierte Adresse aus FF sieht dann sowohl im Quelltext als auch im Nachrichtentext so aus:

    Zitat

    Dieser Link funktioniert in FF und IE und wahrscheinlich auch in allen anderen Browsern.

    Dabei spielt der Zeichensatz (UTF-8 oder ISO-8859-1 bzw. ISO-8859-15) keine Rolle. Ebenfalls ist es irrelevant, ob man den Link per Copy'n'Paste oder über "Hyperlink einfügen" eingefügt hat.

    Die aus IE11 kopierte Adresse wird hingegen zwar im Nachrichtentext richtig angezeigt, funktioniert aber weder in IE noch in FF. Der Link funktioniert nur, wenn man UTF-8 verwendet und ihn per Copy'n'Paste eingefügt hat.

    Dies aber wiederum nur dann, wenn die Option "URL-Pfad als UTF-8 senden" in den erweiterten Internetoptionen von IE11 aktiviert ist, was wohl standardmässig NICHT der Fall ist. Deaktiviert man diese Option (IE muss danach neu gestartet werden), ist das Verhalten wie bei FF. Der Link sieht dann wie oben aus, wird auch so an TB! übergeben und funktioniert danach in allen Browsern.

    Es liegt wohl letztendlich daran, wie ein Browser einen Link mit Umlauten in den Zwischenspeicher und an Drittprogramme wie TB! übergibt.

  • Ich habe im BT eine Test-Mail angehängt (URL.eml). Könnt ihr das Problem damit nachvollziehen? Funktioniert der dort enthaltene Link bei euch?

    Wenn ja, dann spielt der Zeichensatz wohl keine Rolle, denn es ist eine UTF-8 Mail. Wichtig ist wohl nur, wie man den Link einfügt.

    Wenn ihr das Problem mit der Text-Mail nachvollziehen könnt, dann müssten die Entwickler es jetzt endlich auch. Wenn trotzdem nicht, dann muss es in der Tat am dt. OS liegen. Vielleicht kann dann hier jemand es unter einem z.B. englischen Windows testen.

  • Ich habe im BT eine Test-Mail angehängt (URL.eml). Könnt ihr das Problem damit nachvollziehen? Funktioniert der dort enthaltene Link bei euch?

    Wenn ja, dann spielt der Zeichensatz wohl keine Rolle, denn es ist eine UTF-8 Mail. Wichtig ist wohl nur, wie man den Link einfügt.

    Wenn ihr das Problem mit der Text-Mail nachvollziehen könnt, dann müssten die Entwickler es jetzt endlich auch. Wenn trotzdem nicht, dann muss es in der Tat am dt. OS liegen. Vielleicht kann dann hier jemand es unter einem z.B. englischen Windows testen.

    Test-Mail:

    Link im Text Teil funktioniert - Link mit IE11 kopiert funktioniert nicht.
    Anzeige im Browser:

    https://de.wikipedia.org/wiki/Bl�ulinge

    Code
    Ungültiger Titel
    Wechseln zu: Navigation, Suche 
    Der angeforderte Seitentitel enthält eine ungültige UTF-8-Sequenz.

    Marina

  • Link im Text Teil funktioniert

    Hier geht's auch nur um HTML-Mails. Bitte die ersten Posts oben lesen.

    Wenn du das Problem nachvollziehen kannst, dann bitte im BT bestätigen.

    Die Entwickler haben's übrigens nur mit FF und Chrome getestet. Jetzt wollen sie es auch mit IE11 testen. Vielleicht werden sie es dann nachvollziehen können.

    Einmal editiert, zuletzt von sanyok (16. September 2016 um 13:07)

  • Hier geht's auch nur um HTML-Mails. Bitte die ersten Posts oben lesen.
    Wenn du das Problem nachvollziehen kannst, dann bitte im BT bestätigen.

    Die Entwickler haben's übrigens nur mit FF und Chrome getestet. Jetzt wollen sie es auch mit IE11 testen. Vielleicht werden sie es dann nachvollziehen können.

    Das war mir schon klar. Da ich sonst nie HTML Mails schreibe oder lese, ist das gedanklich noch nicht in meine Schreibe geflossen - war aber so gemeint: dass der Link im HTML Teil nicht ging.

    Hier benutze ich nur Opera 12.18, Vivaldi und für andere sturen Seiten eventuell noch Opera Chromium (sehr selten)
    Weder FF, noch Google Chrome noch IE 11 vorhanden!

    Marina

  • Im BT wurden zwei Test-EXEs (32- und 64-Bit) veröffentlicht. Damit funktionieren URLs mit Umlauten, wenn man sie per "Hyperlink einfügen" Icon in eine HTML-Mail einfügt. Dabei spielt der Nachrichtenzeichensatz keine Rolle, da es früher weder mit UTF-8 noch mit ISO-8859-1 oder ISO-8859-15 klappte.

    Das eigentliche Problem, das Ralf oben beschrieben hat, ist jedoch immer noch geblieben. Es geht also darum, dass wenn man eine URL mit einem Umlaut (Beispiel s.o.) in eine HTML-Mail mit dem Zeichensatz ISO-8859-1 per [STRG]+[V] einfügt, diese später nicht funktioniert. So wie ich das verstehe, liegt's daran, dass TB! den Buchstaben "ä" immer mit dem nur für UTF-8 gültigen Hexwert "C3 A4" kodiert. Man sieht dann im Quelltext (F9):

    Code
    <a href="https://de.wikipedia.org/wiki/Bl=C3=A4ulinge">

    Für ISO-8859-1 gilt aber der Hexwert "E4". Daher muss es im Quelltest einer ISO-8859-1 HTML-Mail so aussehen:

    Code
    <a href="https://de.wikipedia.org/wiki/Bl=E4ulinge">

    Mehr dazu steht bei Wiki.

    Bisher konnten die Programmierer das nicht nachvollziehen. Mal sehen, ob wir sie überzeugen können.

  • Korrekt. Das ä ist in den verschiedenen Zeichensätzen anders einzufügen.
    Und The Bat! berücksichtigt das nicht beim Einfügen.

    Da musst du ihnen mal ein Video oder GIF machen, damit die das verstehen.


    The Bat! Pro 11.x BETA (32bit) | Win 11 Pro x64 | GnuPG 2.4.x | XMP + Regula

    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

  • Sie können's immer noch nicht nachvollziehen. Wobei bsirbu schreibt, dass bei ihm im Quelltext Folgendes steht:

    Code
    <a https://de.wikipedia.org/wiki/Bl%C3%A4ulinge">


    "C3 A4" ist aber eine falsche Kodierung für den kleinen Buschstaben "ä" bei einer ISO-8859-1 Mail. Wenn das aber so ist, wieso funktioniert dann der Link bei ihm?!? Vielleicht liegt's doch am deutschen Windows?

  • @Gwen:
    Ralf:
    Im BT wurden u.a. zwei Test-Mails angehängt:

    • URL_ISO-8859-1.eml ist wie es bei mir aussieht, wenn ich die im ersten Post genannte URL in eine ISO-8859-1 Mail per [STRG]+[V] einfüge (deutsches Windows).
    • 00000004.eml ist wie es bei bsirbu von Ritlabs aussieht (russisches Windows).


    Sein Link funktioniert, meiner nicht. Wie sieht es denn bei euch aus? Vielleicht könnt ihr auch etwas dazu im BT schreiben.

  • Bei mir ist es wie bei Dir, Sanyok, und MSE:

    Der Link in URL_ISO_8859-1.eml funktioniert nicht.
    Der Link in 00000004.eml funktioniert.

    Zusatz: Gerade getestet und den Link aus Wikipedia selbst in eine neue Nachricht an mich mit Zeichensatz Westeuropäisch ISO geschickt. Gleiches Schicksal wie bisher: https://de.wikipedia.org/wiki/Bläulinge "Diese Seite existiert nicht".

    TheBat! Pro 10.x (64 Bit) NAU • Win 11x64 Pro • keine PlugIns

    Einmal editiert, zuletzt von Ralf Brinkmann (24. September 2016 um 23:33)