Ext3, Finder und die Zeichenkodierung bei Umlauten

B

bmanc

Mitglied
Thread Starter
Dabei seit
02.05.2004
Beiträge
71
Reaktionspunkte
2
Es ist schon eine Weile her, dass ich folgendes Problem hatte.
https://www.macuser.de/threads/fuse-ext2-hat-probleme-mit-umlauten.504470/

Jetzt habe ich mal zum Testen den Paragon-Ext-Treiber installiert und das Problem scheint dasselbe zu sein. Über die Kommandozeile kann ich auf die Dateien mit Umlauten von der Ext3-Linuxplatte zugreifen über den Finder nicht. Die Dateien werden zwar angezeigt, aber ich kann sie nicht verschieben und auch sonst nicht verarbeiten, z.B. keine Rechte anpassen. Umbenennen geht und dann kann ich mit der Datei wieder alles anstellen.
Dabei ist mir folgendes aufgefallen:

wenn ich die Datei büro, die ich im Linux auf die Platte kopiert habe aus dem Finder in die Browseradressleiste ziehe, ist der Pfad folgender:
file:///Volumes/Untitled/b%C3%BCro/ --> ü = U+00FC (LATIN SMALL LETTER U WITH DIAERESIS)

wenn ich im Finder unter OS X einen neuen Ordner anlege der büro heißt, dann ist der Pfad folgender
file:///Volumes/Untitled/bu%CC%88ro/ --> ü = U+0075 und U+0308 (LATIN SMALL LETTER U + COMBINING DIAERESIS)
diesen kann der Finder dann auch problemlos lesen.

Mir ist jetzt schleierhaft, warum der Finder einen Dateinamen mit einem ü mit Diäresis erzeugt und warum er die ü’s also u-Umlaute, die mit 'c3 bc' vom Linux codiert sind nicht lesen kann?

Weiß da jemand weiter, wie ich den Finder unter 10.5 dazu bringe, das lesen zu können?

grüße
Benny
 
Multibyte Umlaute Ext3 und OS X

Desweiteren habe ich festgestellt, dass das Lesen der Dateien mit Umlauten von der Ext3-Partition im Terminal auch nur funktioniert, wenn man die dort per drag&drop reinzieht. Wenn ich den Pfad händisch in die Kommandozeile eingebe kommt folgendes raus

per Drag and drop
Code:
ls /Volumes/Untitled/büro 
sample.txt
per Eingabe über Tastatur
Code:
ls Volumes/Untitled/büro
ls: Volumes/Untitled/büro: No such file or directory
 
Ok, nach etwas Googlelei bin ich bei unicode.org auf die Normalization Forms gestoßen
http://www.unicode.org/reports/tr15/#Norm_Forms
Dabei fällt mir auf, dass Mac OSX Normalization Form D benutzt und auch nur damit umgehen kann, mein Ubunutu Linux aber Normalization Form C standardmäßig benutzt.

Bringt uns das weiter… Ich schau mal, dass ich das Linux dazu bringe Normalization Form D standardmäßig zu benutzen
 
Eine operable Lösung erstmal in Sicht.
In diesem Text im allerletzten Absatz habe ich den Hinweis gefunden:
Speaking of cross-platform interoperability, Mac OS X has a strange way of handling Unicode-encoded file names. Linux and most other Unix-like OS use the C normalization form (NFC) for encoding to UTF-8, while OS X uses NFD. Convmv can convert file names between these two standards with the —nfc and —nfd switches.

http://www.linux.com/archive/feature/58689
;)http://j3e.de/linux/convmv/man/#hfs__on_os_x___darwin
Werde dann meine komplette Platte mal durch diesen Konverter laufen lassen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: walter_f
Zurück
Oben Unten