Standard-Enkodierung ändern

U

uselessuser

Aktives Mitglied
Thread Starter
Dabei seit
11.09.2005
Beiträge
451
Reaktionspunkte
24
Mahlzeit,

ich möchte, dass systemweit (oder zumindest alles, was in der Konsole passiert) in UTF-16 codiert wird.
locale sagt mir derzeit, "C" sei standard für alles. Was heißt das? Und wie kann ich less etc. dazu bringen, meine Wunschcodierung zu verwenden?
 
Ich schieb Dich mal dahin, wo es passt
 
also ich habe auch z.b. in adium das problem, dass umlaute nicht richtig dargestellt werden und teilweise in safari. würde mich auch interessieren wo man das genau umstellen kann und vor allem welche codierung man braucht.
 
man locale hätte dich zu den enviroment variablen zum setzen geführt...

und benutz mal die suche, wie man die bash dazu bringt UTF zeichen von der tastatur zu schlucken...
 
honigbaer schrieb:
also ich habe auch z.b. in adium das problem, dass umlaute nicht richtig dargestellt werden und teilweise in safari. würde mich auch interessieren wo man das genau umstellen kann und vor allem welche codierung man braucht.

bei adium stellst du das bei den konten einstellungen ein...
mit iso-8859-1 hast du bei den ganzen windows usern keine probleme...

safari hat das unter darstellung/text-kodierung, wobei vernünftig programmierte web-seiten auch die text-kodierung selber angeben und man da nichts einstellen muss...
 
Das mit der Environment habe ich versucht, aber utf-16 ist kein gültiger Identifier. UTF-16 auch nicht. Und locale -m "Lists all avilable public charmaps. This is currently an empty list." de_DE.UTF-16 funktioniert unter Ubuntu, aber hier wird's auch nicht geschluckt. Was mache ich falsch?
 
locale -a
de_DE.UTF-8

UTF-16 wird nicht unterstützt...
wozu brauchst du überhaupt UTF-16? so viel mit multibyte sprachen zu tun?
 
Oh. Danke... *dumm*

Ich brauche eigentlich nur die Möglichkeit, mir Umlaute anzeigen zu lassen. Hier liegen haufenweise (deutschsprachige) Textdateien aus einem OCR-Programm herum, mit denen ich arbeiten muss. Diese sind nur in UTF-16 ordentlich zu lesen, aber außer cat kann irgendwie kein Programm mehr als rote @s ausgeben.
 
export LANG=de_DE.ISO8859-1
Und im Terminal.app > Fenstereinstellung > Darstellung > Kodierung "Latin-1" wählen.
 
uselessuser schrieb:
Oh. Danke... *dumm*

Ich brauche eigentlich nur die Möglichkeit, mir Umlaute anzeigen zu lassen. Hier liegen haufenweise (deutschsprachige) Textdateien aus einem OCR-Programm herum, mit denen ich arbeiten muss. Diese sind nur in UTF-16 ordentlich zu lesen, aber außer cat kann irgendwie kein Programm mehr als rote @s ausgeben.

ähhhhh, musst du zwangsläufig mit der shell arbeiten?
warum benutzt du einfach ein textprogramm?
selbst textedit unterstützt utf-16...
 
Danke maceis, aber Latin1 möchte ich nicht verwenden, da es dann Probleme mit dem Austausch zu Ubuntu gibt. Ist 'ne Partnerarbeit.

Die shell ist leider nötig, da die Texte noch ziemlich viel Weiterverarbeitung vor sich haben. Am Ende soll da ein Korpus draus entstanden sein, wenn das jemandem was sagt. Sprich, man muss da mit Perl ran.
 
uselessuser schrieb:
Die shell ist leider nötig, da die Texte noch ziemlich viel Weiterverarbeitung vor sich haben. Am Ende soll da ein Korpus draus entstanden sein, wenn das jemandem was sagt. Sprich, man muss da mit Perl ran.

und?
nur zum anzeigen kannst du doch textedit benutzen, oder?
perl interessiert die locale setting doch wenig, oder?
die text-kodierung ist doch auch in dem text-file enthalten, die musst du doch nur auslesen, und perl das entsprechend handeln lassen...
 
Schau dir mal BBEdit oder TextWrangler an (kleine Variante von BBEdit). Die können sehr gut mit text-codierungen arbeiten.

Gruß
Richard
 
Klar kann Perl das auch so. Aber ernsthaft, ich finde es, sagen wir "unhandlich", weder den vi noch less verwenden zu können.

Gibt es denn eine einfache shell-Möglichkeit, die textcodierung einer Datei zu erfahren?
 
mit "file" kannst du dir den typ einer datei anzeigen lassen...
 
bei adium haben die umlaute auch mit 8859-1 noch falsche darstellungen. die gegenseite benutzt icq5. also das problem besteht eigentlich immer nur bei den away messages. aber selbst da nicht durchgehend: hören und aufräumen werden richtig geschrieben. verfügbar hingegen nicht, da verkommt das ü zu einem großen A mit umgedrehtem accent circonflexe und einem 1/4.
sehr seltsame sache.
 
honigbaer schrieb:
bei adium haben die umlaute auch mit 8859-1 noch falsche darstellungen. die gegenseite benutzt icq5. also das problem besteht eigentlich immer nur bei den away messages. aber selbst da nicht durchgehend: hören und aufräumen werden richtig geschrieben. verfügbar hingegen nicht, da verkommt das ü zu einem großen A mit umgedrehtem accent circonflexe und einem 1/4.
sehr seltsame sache.

dann hast du nicht das umlaut/enkodierungs-problem, sondern der...
 
dass windows user probleme haben ist unbestritten, aber gut zu wissen, dass es noch eins mehr ist als bisher angenommen ;)
 
Zuletzt bearbeitet:
Zurück
Oben Unten