HTML und Umlaute

maceis · 16.01.2005

?=? schrieb:
"file" kann's den bytes halt nicht ansehen mit welcher Absicht (=welcher Kodierung) sie geschrieben wurden.
Es gibt keine "Magic Numbers" anhand derer "file" irgendwas konkretes identifizieren kann. Bei HTML gibt's noch die charset-Angabe, die "file" nutzen kann ...

Das kann so - glaube ich - nicht stimmen. Irgendwie muss den Textdateien die Kodierung "anzusehen" sein.
Es würde zu weit gehen, jetzt meine Umgebung im Detail zu beschreiben.
Nur soviel: Ich habe bei meinem aktuellen projekt exakt eine html-Seite mit dem html-header (incl. meta charset...). Ich setze die Seiten mit perl und CGI::Templat zusammen, was ne Menge Erstellungs- und Pflegeaufwand spart.
PHP-Dateien sind vereinzelt vorhanden, da ich die "noch hatte".

mit file [-i] * bekomm ich ein buntes Misch-Masch von Kodierungen angeboten,was mich eben etwas verwirrt hat; z. B.:

text/plain; charset=us-ascii
text/plain; charset=iso-8859-1
text/plain; charset=unknown
text/plain; charset=utf-8
UTF-8 Unicode HTML document text
ASCII text
UTF-8 Unicode text (ist auch ein .html-Dokument)
Non-ISO extended-ASCII text

Neben den Einstellungen am Webserver muss ich jetzt meine Shell noch so einstellen, dass mein Editor mir schön brav alles als utf-8 abspeichert, dann kann das Ganze klappen.

Scribble · 17.01.2005

Gilt das auch, wenn ich mir die Seiten nur mit dem lokalen Webserver oder nem Texteditor ansehe?

Nein, nur nach dem Download vom Server auf die Festplatte - also losgelöst vom Nutzungskontext Auslieferung durch Webserver oder Öffnen im konfigurierten Texteditor.

HTML und Umlaute

maceis

Aktives Mitglied

Scribble

Aktives Mitglied