Problem mit CSV-Datei (UTF-8)

S

silentx

Aktives Mitglied
Thread Starter
Dabei seit
30.08.2011
Beiträge
375
Reaktionspunkte
16
Es geht um iOS 5.1
Ich mache einen Export als *.csv Datei, darin habe ich natürlich auch Umlaute. Wenn ich dieses File z.B im TextEdit anschaue sieht es absolut korrekt aus. Wenn ich es allerdings mit Mac Excel 2011 öffne, wertem Umlauge immer zu undefinierbaren Zeichen:
Beispiel: während wird zu während

Weiss jemand eine Möglichkeit wie das gemacht werden könnte?
PS: Gesucht habe ich bereits im Internet, aber auch mit Import Externer Daten, kann ich zwar UTF-8 auswählen dann wird aber während einfach zu w_hrend, was auch nicht gut ist,
 
Export aus Numbers? Kannst Du mir mal ein Beispiel schicken?

Danke

Alex
 
ist das denn ein UTF-8 mit oder ohne BOM?
kannst den export nicht umstellen auf latin1?
 
UTF-8 mit BOM? Welche BO soll UTF-8 denn haben? :kopfkratz:

das sind trotzdem 2 byte pro zeichen, sonst würde auch nicht während draus werden...
wirf mal einen blick in UTF-8 file mit einem hexeditor...
 
das sind trotzdem 2 byte pro zeichen, sonst würde auch nicht während draus werden...
wirf mal einen blick in UTF-8 file mit einem hexeditor...

Das ist mir völlig klar. Dennoch gibt es in UTF-8 nur genau eine Reihenfolge, in welcher der Codepoint codiert wird: 'ä' (U+00E4) wird in UTF-8 IMMER als 0xc3 0xa4, niemals 0xa4 0xc3 codiert.

;)

Alex (Unicode Nerd)
 
hab mich dann mal eben schlau gewiki't
http://de.wikipedia.org/wiki/Byte_Order_Mark

Die UTF-8-Kodierung des BOM besteht aus der Bytesequenz EF BB BF, die in nicht UTF-8-fähigen Texteditoren und Browsern meist als ISO-8859-1-Zeichen  erscheinen. Bei UTF-8 stellt sich das Problem der Byte-Reihenfolge zwar nicht, doch ein BOM am String- oder Dateianfang ist erlaubt, um die Verwendung von UTF-8 als Kodierung zu kennzeichnen. Eine sichere Unterscheidung zwischen UTF-8 und den ISO-8859-Zeichensätzen ist dadurch zwar nicht gewährleistet, da in den 8-Bit-Zeichensätzen alle Bytesequenzen erlaubt sind, auch die UTF-8-Kodierung des BOM; wenn aber die Alternative speziell UTF-8 oder ISO 8859-1 ist, ist die pragmatische Annahme, dass die Zeichenfolge  nicht gemeint ist, durchaus üblich.
 
  • Gefällt mir
Reaktionen: below
OK. Leute, die ISO-8859 verwenden lasse ich Nachts von einer Bande Kampfhamster töten …

Alex
 
  • Gefällt mir
Reaktionen: zagdul und _ebm_
Habe gerade gemerkt, dass ich mich anscheinend nicht ganz "gut" ausgedrückt habe bzw. was wichtiges vergessen habe.

Das File *.csv erstelle ich mit dem iOS, also meiner App. Da ist 'während' als UTF-8 gespeichert.

1. MS Excel 2011 -> CSV -> iPhone App, kein Problem mit Umlauten
2. iPhone App -> CSV -> MS Excel 2011 , Problem mit Umlauten
3. Kein Problem wenn ich es mit TexEdit vom Mac mache
4. Numbers? Hab ich gerade auf meinem MacBook Pro nicht.

Im Internet findet man viele Post's wo besagen, das Excel auf dem MAC Probleme hat mit UTF-8.

PS: Das gleiche File hat bei Windows 7 - Office 2007 keine Problem beim UTF-8 Import :)
 
wir hatten dich schon verstanden.
aber an sich ist es nichts neues, das microsoft produkte nicht so ganz mit UTF-8 umgehen können...
ist natürlich peinlich, wenn es die windows version kann und die mac version nicht.

also deine testdatei ist ohne BOM.
vielleicht ist es mit BOM schmerzloser?
kannst ja mal probeweise mit einem hexeditor einfügen.
 
Schick uns doch mal so eine Datei.

Alex
 
Hier mal mit BOM, obwohl nicht sicher bin dass dies so korrekt sein soll. Leider macht MS 2011 dies immer noch falsch auf? (Kenne BOM eigentlich nicht, hab es jetzt mal so gemacht wie im WIKI beschrieben)
 
Habe das gerade mal Testweise mit Excel 2011 probiert: Tatsache, das wird falsch importiert … Ich schreib mal einen Bugreport …

Alex
 
  • Gefällt mir
Reaktionen: silentx
Mac EXCEL Import UTF-Dateien
Ich schreibe meine Daten in normale Textdateien mit Platzhalter für Feldtrennzeichen. Da ich das seit Anfang an so gewöhnt bin und zeitweise für fünf verschiedenen Systeme kompatibel sein musste/wollte (ATARI, WINDOWS, PSION, MAC, iPad), hatte ich dafür früher Windows-Kodierung, bin aber mit der Omnipräsenz von UTF schließlich dazu übergegangen.
Hatte bisher ein ähnliches Probelm: bis EXCEL 2011 kann der Mac nicht mit UTF-Dateien umgehen.
Mit TEXTWRANGLER klappt die Umkodierung nicht immer, ich weiß nicht, warum.
Bisher half mir bei längeren Texten "codepage conversion" (https://www.motobit.com/util/charset-codepage-conversion.asp), das funktioniert nun nicht mehr. Ich weiß nicht, warum.
Abhilfe: Textdatei in NUMBERS öffnen. Das muss nicht unbedingt eine Datensammlung sein, kann auch ganz normaler fortlaufender Text sein. Sollen Daten weiterverarbeitet werden (z.B. in EXCEL oder FILEMAKER), als EXCEL exportieren. Das behebt auch das Problem mit Anführungszeichen im Text. (Die üblicherweise dazu führen, dass der ganze Text am Anfang und Ende nochmal Anführungszeichen erhält.) Die EXCEL-Datei lässt sich so in FILEMAKER importieren.
Ansonsten Export als CSV-Datei, dabei kann die gewünschte Kodierung ausgewählt werden. Diese Datei ließe sich dann in txt umbennen und steht so zur Weiterverabeitung zur Verfügung.
 
Zurück
Oben Unten