TGY
Aktives Mitglied
Thread Starter
- Registriert
- 12.04.2004
- Beiträge
- 1.141
- Reaktionspunkte
- 106
Hallo.
Ich habe automatisch eingelesene Texte/Lyrics, die immer mal wieder "Mojibake"-Zeichen enthalten - wohl als Resultat falscher Enkodierung.
Hier eine (nicht abschließende) Liste der schrottigen Zeichen:
Nun versuche ich ein Applescript-Skript zu erstellen, dass diese Zeichen automatisch durch die richtigen Zeichen ersetzt.
Ich könnte natürlich jedem Schrottzeichen ein korrektes Zeichen zuzuweisen.
Doch ich würde zunächst gerne wissen, ob ich das mit (ggf. mehrfachem) Dekodieren erreichen kann.
Hier ein Beispiel für eine nicht funktionierende Dekodierung mit iconv:
Hab einige Kodierungsvarianten (inkl. doppelter Dekodierung) mit iconv ausprobiert. Doch ich sehe den Wald vor lauter Bäumen nicht und habe bis jetzt nicht den korrekten String als Ergebnis erhalten.
Kennt sich jemand mit Kodierungen aus und kann mit einen Tip geben? Vielen Dank.
P.S. macOS 15.5
Ich habe automatisch eingelesene Texte/Lyrics, die immer mal wieder "Mojibake"-Zeichen enthalten - wohl als Resultat falscher Enkodierung.
Hier eine (nicht abschließende) Liste der schrottigen Zeichen:
AppleScript:
property specialChars : {"Ä", "Ã…", "Ç", "É", "Ñ", "Ö", "Ü", "À", "Ã", "Õ", "Ÿ", "Â", "Ê", "Ã", "Ë", "È", "Ã", "ÃŽ", "Ã", "ÃŒ", "Ó", "Ô", "Ã’", "Ú", "Û", "Ù", "ä", "Ã¥", "ç", "é", "ñ", "ö", "ü", "à ", "ã", "õ", "ÿ", "â", "ê", "á", "ë", "è", "Ã", "î", "ï", "ì", "ó", "ô", "ò", "ú", "û", "ù"}
Nun versuche ich ein Applescript-Skript zu erstellen, dass diese Zeichen automatisch durch die richtigen Zeichen ersetzt.
Ich könnte natürlich jedem Schrottzeichen ein korrektes Zeichen zuzuweisen.
Doch ich würde zunächst gerne wissen, ob ich das mit (ggf. mehrfachem) Dekodieren erreichen kann.
Hier ein Beispiel für eine nicht funktionierende Dekodierung mit iconv:
AppleScript:
set aa to quoted form of "Desinfektionslösungstücher für Flächen" --> Desinfektionslösungstücher für Flächen
set bb to do shell script "echo " & aa & " | iconv -f iso8859-9 -t utf8"
Hab einige Kodierungsvarianten (inkl. doppelter Dekodierung) mit iconv ausprobiert. Doch ich sehe den Wald vor lauter Bäumen nicht und habe bis jetzt nicht den korrekten String als Ergebnis erhalten.
Kennt sich jemand mit Kodierungen aus und kann mit einen Tip geben? Vielen Dank.
P.S. macOS 15.5