Keine Umlaute beim Importieren von vCard-Dateien ins Adressbuch

  • Liebes Forum,


    ich wollte vorhin die Adressbücher meines iPhone und von The Bat auf den gleichen Stand bringen. Dazu habe ich zunächst die Adressen des iPhone mit der Software iExplorer als VCF-Dateien exportiert. Der Import in The Bat hat im Prinzip auch geklappt. Nur leider hat The Bat die Umlaute in den Namen nicht übernommen, ebenso gibt es Fehler bei Namen mit Akzenten.


    iExplore erzeugt VCF-Dateien im Format 3.0 ohne CHARSET-Definition. Die Informationen in den Dateien selbst scheinen korrekt zu sein, denn Windows zeigt die "kritischen" Namen ohne Probleme an.


    Ich verwende The Bat 6.5 (32 Bit) auf Windows 7. Wie kann ich The Bat dazu bringen, die Umlaute richtig zu importieren und anzuzeigen? Es ist ja sicher nur ein Zeichensatz-Problem.


    Vielen Dank im Voraus für eure Antworten.


    Harald

  • Hallo Harald,
    so ganz genau weiß ich nicht was dein Smartphone liefert.
    Aber The Bat! will UTF.


    The Bat hat mindesttens seit 6.0 die Inhalte in UTF-8 kodiert.
    Der Inhalt muss UTF-8 kodiert sein!


    Warum dein iPhone-Export kein UTF-8 liefert ist seltsam. Apple-Murks? Oder seltsame Exportroutine bei iExplorer?


    Du kannst ja solche VCF-Dateien in Notepad++ öffnen und dann dort Kodierung -> Konvertiere zu UTF-8 ohne BOM wählen.


    melde dich doch bitte nochmals.

    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

    2 Mal editiert, zuletzt von GwenDragon ()

  • Ich habe jetzt gesehen, dass TB! z.B. beim Export zwei VCF-Versionen zur Auswahl anbietet: vCard v2.1 und v3.0. Ich nehme an, dass sie auch beim Import unterstützt werden. Mittlerweile gibt's sogar schon v4.0, aber noch nicht in TB! So wie ich das sehe, werden die Daten erst seit v3.0 standardmäßig mit Unicode (UTF-8) gespeichert, bei v2.1 hingegen können die Daten mit unterschiedlichen Zeichensätzen gespeichert werden. Der jeweilige Zeichensatz muss dabei in v2.1 extra angeben werden. Fehlt er, sollten die Daten nur ASCII-Zeichen enthalten, da andere flöten gehen werden.


    Wenn man die VCF-Datei mit einem Editor betrachtet, sieht man ganz oben:

    Code
    BEGIN:VCARD
    VERSION:x.x

    Wenn anstelle von x.x -> 2.1 steht, sollte man darauf achten, dass auch der Zeichensatz definiert ist. Bei entsprechenden Daten sollte also zusätzlich

    Code
    CHARSET=UTF-8

    stehen. TB! z.B. macht das so beim Export.


    Bei v3.0 gibt's den Charset-Eintrag hingegen nicht, weil, wie gesagt, seit v3.0 standardmäßig UTF-8 verwendet werden soll. So steht's auch in der offiziellen Spezifikation RFC-6350:

    Zitat

    The charset for vCard is UTF-8. There is no way to override this. It is invalid to specify a value other than "UTF-8" in the "charset" MIME parameter.

    Und dann weiter unten:

    Zitat

    Encodings other than UTF-8 MUST NOT be used.


    Allerdings steht z.B. bei Wiki:

    Zitat

    Ein Export als vCard ist nicht immer möglich und die Unterstützung der Versionen 2.1, 3.0, 4.0 ist uneinheitlich.

    Daraus folgt wohl, dass jedes MUA das so handhabt, wie es will. :D

  • Hallo GwenDragon & sanyok,


    vielen Dank für eure Hilfe. Ihr habt genau den wunden Punkt getroffen:


    Die VCF-Dateien, die iExplorer generiert, haben als Versionsnummer die "3.0" stehen; eine CHARSET-Festlegung gibt es nicht.
    Der Inhalt selber ist aber in ISO-8859-1 o.ä. kodiert, wie mir eine kurze Untersuchung mit dem Hex-Modus in UltraEdit gezeigt hat. Nach Konvertierung in UTF-8 waren alle Zeichen brav 2 Byte breit und The Bat hat alle Umlaute, Sonderzeichen u.ä. korrekt übernommen.


    Der Fehler scheint also in iExplorer zu liegen, das die Zeichen nicht standardkonfom kodiert. Bis das gefixt ist, brauche ich nun also ein Werkzeug, das mir meine 250 Kontaktdateien am Stück konvertiert. Kennt ihr da was Vernünftiges?


    Schön wäre ja auch, wenn The Bat endlich mal in Remote-Adressbuch mit CardDAV/CalDAV-Sync kriegen würde. Dann könnte man sich die ganze Konvertierei mit x Einzelprogrammen sparen.


    Viele Grüße,
    Harald

  • Schön wäre ja auch, wenn The Bat endlich mal in Remote-Adressbuch mit CardDAV/CalDAV-Sync kriegen würde. Dann könnte man sich die ganze Konvertierei mit x Einzelprogrammen sparen

    Ja, darauf warten schon einige.
    Den Wunsch bei Ritlabs kannst du unterstützen!


    Für die Umkodierung ist iconv ganz gut.
    In der DOS-Box:
    iconv -t utf-8 VONDATEI.VCF > NACHDATEI.VCF


    The Bat! Pro 9.x BETA (32bit) | Win 10 Pro x64 | GnuPG 2.2.x | XMP + Regula


    Wer mich Er oder der Drache nennt, bekommt von der Drachin Pratze und Feuer zu spüren.

    2 Mal editiert, zuletzt von GwenDragon ()