Was ist der Vorteil von UTF-8?

Nur zum Verständnis:

Wenn ich Sonderzeichen direkt eingebe muss ich die Datei im UTF-8 Format speichern damit es im Browser problemlos angezeigt wird oder?
 
Konform sind beide Wege

Wie ich schon schrieb, darauf ein klares JEIN! Für alte Systeme hast Du sicher recht. HTML ist nunmal recht fehlertolerant. Eine XML-Datei ohne Angabe eines charset ist aber meines Wissens nicht valide. Da xHTML der Weg von HTML hin zu XML ist ( am Ende sollen ja alle Browser XML sprechen), gibt es halt zukünftig nur diesen gültigen Weg.
Bei etablierten Systemen mit alten Clienten, hast Du nat. vollkommen recht. Da geht das mit Entities allein sehr wohl. Auch in XML geht es so, nur ist der charset dazu dann dort ein must have!
 
@Retrax: dein Server liefert den HTTP-Datenstrom in einem bestimmten Charset aus. Mit diesem charset solltest Du auch Deine Dateien schreiben. Weichst Du davon ab, mußt Du das von mir genannte Meta-Tag verwenden. Sprich wenn Du in UTF-8 speicherst, dann solltest Du auch UTF-8 als charset angeben ( es sei denn der Server verwendet UTF-8 per Default).
 
wegus schrieb:
@Retrax: dein Server liefert den HTTP-Datenstrom in einem bestimmten Charset aus. Mit diesem charset solltest Du auch Deine Dateien schreiben. Weichst Du davon ab, mußt Du das von mir genannte Meta-Tag verwenden. Sprich wenn Du in UTF-8 speicherst, dann solltest Du auch UTF-8 als charset angeben ( es sei denn der Server verwendet UTF-8 per Default).

aha... die Charset Angabe ist ja obligatorisch wenn man vor dem W3C Validator bestehen will, oder?

Wenn man z.b. in Taco die Sonderzeichen direkt eingibt dann lässt sich die Datei nur in der UTF-8 Codierung speichern. Mit Entities dann eben normal als "plain text". Welche Variante ist zu bevorzugen?

Die Entities Variante ist kompatibler oder?
 
wegus schrieb:
Auch in XML geht es so, nur ist der charset dazu dann dort ein must have!

Da gebe ich dir Recht. Wobei ich nie dafür war, die Charset Definition abzuschaffen oder aus sonstigen Gründen nicht reinzuschreiben. Die sollte schon drin stehen.

@RETRAX
Ja, die Entities Variante ist kompatibler, insbesondere zum damit arbeiten, da nicht jeder editor auf jedem system automatisch utf-8 kann und versteht.
Und hinterher muß man sich auch nicht um die codepage kümmern, auch wenn sie, wie oben erwähnt, natürlich im fertigen Dokument drinstehen sollte.

HTML stammt von SGML ab, xHTML von XML.

Der Sinn von xHTML liegt in erster Linie in der automatischen Erzeugung von Code, da ich xHTML recht einfach aus einer XML Datenquelle mittels XSLT Stylesheets erzeugen kann.

Für den Webdesigner, der Seiten "von Hand" macht, ist es letztendlich völlig wurscht (wobei er heute besser beraten wäre xhtml zu lernen).
 
HTML stammt von SGML ab, xHTML von XML.

Das ist fast richtig. HTML ist mittels SGML gebildet worden, aber eben wesentlich toleranter als ein SGML System. XML ist ebenfalls ein Subset von SGML. XHTML ist eine Implementierung von HTML durch ein XML-DTD oder Schema, also HTML in XML. Der korrekte Weg ist also:

SGML->XML->XHTML-HTML

Das ist auch der Grund warum man in XHTML nicht mehr nur ein

<br> schreiben darf, sondern

<br></br>

oder <br/>

wie gesagt. Langfristig wird ( gerade auch durch die Bestrebung des semantsichen Webs), HTML verschwinden. XHTML ist "nur" ein Werkzeug für den Übergang hin zu XML. Wer also in purem HTML agiert sollte sich bewußt sein, daß da das Ende bald erreicht ist, er also eine alte Technologie verwendet!
 
wegus schrieb:
wie gesagt. Langfristig wird ( gerade auch durch die Bestrebung des semantsichen Webs), HTML verschwinden. XHTML ist "nur" ein Werkzeug für den Übergang hin zu XML. Wer also in purem HTML agiert sollte sich bewußt sein, daß da das Ende bald erreicht ist, er also eine alte Technologie verwendet!

denkst du auch dass die Clients die den HTML Standard beherrschen verschwinden werden? Kann ich mir nicht so recht vorstellen. Ich denke die Abwärtskompatibilität gerade zum standardisierten HTML wird auch in zukünftigen Browsern integriert sein.
 
@Retrax: Auch Windows XP kann heut noch 16Bit :)

So muß man das wohl sehen. Nat. wird das noch ein paar Jährchen gehen. Mit Abstrichen gegen die aktuelle Technik, aber es wird gehen. Nur die Bewegung ist halt weg von dort und nicht mehr hin zu! Aber ähnlich wie mit TCP/IPv6 wirds wohl länger dauern, bis das Akzeptanz findet...
Bei XML gehts ja um mehr als nur das Design einer Webseite. Da gehts um Informationsverarbeitung, um WebDav-Dienste und Ähnliches. Ich kann mir aber gut vorstellen, daß es 2008 heißt die Seite ist "noch in HTML", da mußt Du aufpassen.
 
RETRAX schrieb:
aha... die Charset Angabe ist ja obligatorisch wenn man vor dem W3C Validator bestehen will, oder?
...
Nein, das ist nicht so.
Es muss aber der Server richtig konfiguriert sein, damit der Validator weiss, von elchem character set er ausgehen muss.

Dann werden allerdings auch Umlaute die nicht als Entities kodiert sind als valide anerkannt.
Dder Grund, warum man IMO auf die Kodierung der Umlaute verzichten kann/sollte, ist der, dass man ohnehin sich um die Konfiguration des richtigen charsets kümmern muss und dann kommts auch nicht zu Anfängerfehlern (;)) wie falscher Darstellung im Browser.
 
Zurück
Oben Unten