Was ist der Vorteil von UTF-8?

heldausberlin

heldausberlin

Aktives Mitglied
Thread Starter
Dabei seit
01.05.2004
Beiträge
13.873
Reaktionspunkte
340
Sämtliche OSX-Programme codieren erstellte Websites (z.b. Galerie) in UTF-8.
Wenn man diese dann in eine iso-codierte Website einbettet, gibt's immer Probleme mit den Sonderzeichen.
Also bleibt einem nichts anderes übrig, als die gesamte Website in UTF-8 zu konvertieren.
Dann gibt's aber Schwierigkeiten, wenn man z.B. ein Gästebuch hat, dass auf eine iso-codierte Datenbank zugreift.


ISO hin, UTF her. Was ist denn eigentlich der Unterschied und der Vor- und Nachteil der beiden?
 
heldausberlin schrieb:
Sämtliche OSX-Programme codieren erstellte Websites (z.b. Galerie) in UTF-8.
Wenn man diese dann in eine iso-codierte Website einbettet, gibt's immer Probleme mit den Sonderzeichen.

Vielleicht weil der Code Müll ist?
In HTML werden Sonderzeichen als Entities geschrieben oder mit einem Symbol und ihrer Unicode Repräsentation beschrieben. Und nicht einfach reingeschrieben (Annfängerfehler).
 
Incoming1983 schrieb:
Vielleicht weil der Code Müll ist?
In HTML werden Sonderzeichen als Entities geschrieben oder mit einem Symbol und ihrer Unicode Repräsentation beschrieben. Und nicht einfach reingeschrieben (Annfängerfehler).
Ich weiß nicht, ob man von einem Surfer erwarten kann, dass er statt Umlaute &...uml; ins Gästebuch einträgt. :rolleyes:
 
Incoming1983 schrieb:
Vielleicht weil der Code Müll ist?
In HTML werden Sonderzeichen als Entities geschrieben oder mit einem Symbol und ihrer Unicode Repräsentation beschrieben. Und nicht einfach reingeschrieben (Annfängerfehler).

Tja ich würde mich nicht als Anfänger bezeichnen und ziehe es doch vor die Sonderzeichen so einzutippen wie sie auf der Tastatur vorkommen, sonst wird der "Code" unleserlich und bedeutet einen zusätzlichen und eigentlich unnötigen Aufwand.
 
heldausberlin schrieb:
Ich weiß nicht, ob man von einem Surfer erwarten kann, dass er statt Umlaute &...uml; ins Gästebuch einträgt. :rolleyes:

Muß man nicht. Die Sonderzeichen werden hierbei sowieso kodiert übertragen, und von der Gästebuchsoftware dann eben als &..uuml abgelegt.

Ist schon seit Jahrzehnten kein Problem ;-)

Gibt aber Gästebuch- und Forenprogrammierer, die es bis heute nicht raffen (z.B. bei World of Warcraft)
 
heldausberlin schrieb:
Ich weiß nicht, ob man von einem Surfer erwarten kann, dass er statt Umlaute &...uml; ins Gästebuch einträgt. :rolleyes:
Kannst du in deinem GB die Header anpassen? Wenn ja, schreib einfach die ISO-8859-1 Deklaration mit rein. Dann passt es wieder.
 
konben81 schrieb:
Tja ich würde mich nicht als Anfänger bezeichnen und ziehe es doch vor die Sonderzeichen so einzutippen wie sie auf der Tastatur vorkommen, sonst wird der "Code" unleserlich und bedeutet einen zusätzlichen und eigentlich unnötigen Aufwand.

Dann hol dir einen gescheiten HTML Editor, der macht dann beim Abspeichern die Sonderzeichen draus. Oder einen Editor, bei dem du dann Makros auf die tasten legst.

Die Sonderzeichen an sich haben im HTML nichts verloren, es ist schlichtweg falsch und führt zu Darstellungsfehlern.

Für den Nicht-Anfänger wird der Code auch nicht unleserlich, da liest man drüber weg, ebenso beim Tippen im einem herkömmlichen Editor. Nach ner halben Seite tippt man automatisch die richtigen Entities (auch bei Latex und Co.). Reine Gewöhnungssache.
 
Incoming1983 schrieb:
Vielleicht weil der Code Müll ist?
In HTML werden Sonderzeichen als Entities geschrieben oder mit einem Symbol und ihrer Unicode Repräsentation beschrieben. Und nicht einfach reingeschrieben (Annfängerfehler).
Die Zeiten sind IMHO längst vorbei.
Ich halte mich auch nicht mehr für einen Anfänger und schreibe Umlaute etc. direkt in den Code - und zwar ohne, dass es zu Darstellungsfehlern kommt.
Stell Dir nur mal vor, Du musst eine Website in kyrillisch erstellen *äääächz* und pflegen.
Und das hier muss ja auch irgend einen Sinn haben, oder?
 
Es geht weniger ums Gästebuch als viel mehr um die Webalben, die ich schnell und einfach mit Galerie erstelle.
Dabei werden die Titel und Kommentare aus den iPhoto-Alben verwendet.
Und diese Umlaute werden nicht codiert. Wenn ich diese dann in eine Seite mit iso-latin-1 integriere (z.B. per "include()" oder als Frame), gibt's Probleme.
 
maceis schrieb:
Die Zeiten sind IMHO längst vorbei.
Ich halte mich auch nicht mehr für einen Anfänger und schreibe Umlaute etc. direkt in den Code - und zwar ohne, dass es zu Darstellungsfehlern kommt.
Stell Dir nur mal vor, Du musst eine Website in kyrillisch erstellen *äääächz* und pflegen.
Und das hier muss ja auch irgend einen Sinn haben, oder?

Schau dir einfach die aktuellen HTML Spezifiationen an, oder auch bei Selfhtml, dort steht, wie Umlaute kodiert werden.

Für Seiten auf kyrillisch würd ich mir einen angepaßten Editor nehmen.

Zum Fragesteller: Du weißt, welche Codierung ursprünglich benutzt wurde. Also läßt du das zu includierende Dokument parsen mit Hilfe von regulären Ausdrücken und ersetzt die Umlaute durch Entities, und gut is.
 
Incoming1983 schrieb:
Du weißt, welche Codierung ursprünglich benutzt wurde. Also läßt du das zu includierende Dokument parsen mit Hilfe von regulären Ausdrücken und ersetzt die Umlaute durch Entities, und gut is.
Ich möchte vermeiden, dass ich die Webalben vor dem Hochladen noch in irgendeiner Weise verändern muss.


Zur Datenbank:
Wie kann ich in CocoaMySQL die Codierung einer ganzen Datenbank ändern?
Da ist zwar links die Code-Liste, aber irgendwie will das nicht. kopfkratz
 
heldausberlin schrieb:
Ich möchte vermeiden, dass ich die Webalben vor dem Hochladen noch in irgendeiner Weise verändern muss.

mach dir ein kleines Skript und einen fetten Button dazu, dann mußt du grad einmal draufklicken ;-)

Ansonsten kannst aufm Webserver das Zeug ebenfalls Parsen und ersetzen lassen (z.B. über ein CGI Programm), dann mußt gar nix tun..
 
Incoming1983 schrieb:
mach dir ein kleines Skript und einen fetten Button dazu, dann mußt du grad einmal draufklicken ;-)

Ansonsten kannst aufm Webserver das Zeug ebenfalls Parsen und ersetzen lassen (z.B. über ein CGI Programm), dann mußt gar nix tun..
Keine Ahnung wie. :confused:
Aber hört sich gut an! :)
 
heldausberlin schrieb:
Keine Ahnung wie. :confused:
Aber hört sich gut an! :)

Also, kurz zusammengefaßt:
Du speicherst das Zeug ab, lädst es hoch.
Das wird aber nicht direkt angezeigt, sondern du rufst mit deiner URL ein CGI auf (z.B. ein Perl skript).
Dieses Skript liest die Datei aus, und schreibt sie auf die Standardausgabe, wobei eben die Sonderzeichen als Entities ausgegeben werden.
Der Browser sieht dann die Entities und ist glücklich.
Und du auch, weil deine Sonderzeichen lesbar (zumindest auf dem Ursprungssystem) drinstehen.
 
Okay. Und wie erstelle ich so ein CGI-Skript? Gibt's dafür nen hilfreichen Link? Danke schon mal.
 
Incoming1983 schrieb:
Schau dir einfach die aktuellen HTML Spezifiationen an, oder auch bei Selfhtml, dort steht, wie Umlaute kodiert werden.
...
Und wofür wurde Deiner Ansicht nach so etwas erfunden?
HTML:
<meta http-equiv="content-type" content="text/html; charset=utf-8">
Das ist valides HTML, oder nicht?
Und wofür unterstützen WebBrowser so um die 30 Text-Kodierungen?

Wenn Du Spezifikationen anführst, dann wäre es schön, wenn Du zum einen die zutreffenden wählen und diese auch konkret benennen würdest.
Ich halte z.B. das hier für passend.
Da steht ausdrücklich, dass man z.B utf-16 verwenden kann.

Versteh mich nicht falsch; natürlich kann man mit Entities arbeiten.
Es ist aber deutlich überzogen, zu behaupten, alles andere wäre falsch.
 
heldausberlin schrieb:
Okay. Und wie erstelle ich so ein CGI-Skript? Gibt's dafür nen hilfreichen Link? Danke schon mal.

de.selfhtml.org

Dort die Grundlagen zu CGI lesen. Wenn du nie was damit gemacht hast, wirds einige Einarbeitungszeit benötigen, aber es lohnt sich.
 
Incoming1983 schrieb:
Also, kurz zusammengefaßt:
Du speicherst das Zeug ab, lädst es hoch.
Das wird aber nicht direkt angezeigt, sondern du rufst mit deiner URL ein CGI auf (z.B. ein Perl skript).
Dieses Skript liest die Datei aus, und schreibt sie auf die Standardausgabe, wobei eben die Sonderzeichen als Entities ausgegeben werden.
Der Browser sieht dann die Entities und ist glücklich.
...
:rolleyes: :rolleyes: :rolleyes:
Tut mir Leid, aber wenn Du von Anfängerfehlern sprichst und dann sowas vorschlägst kann ich nur den Kopf schüttel.
Du erzeugst einen Overhaed, der absolut durch nichts zu rechtfertigen ist.

Sie mal bitte in Safari unter "Darstellung - Text-Codierung" nach, mit welchen Kodierungen Du Safari (so wie andere Browser) alles glücklich machen kannst :D.
 
Zurück
Oben Unten