HTML und Umlaute

?=? schrieb:
"file" kann's den bytes halt nicht ansehen mit welcher Absicht (=welcher Kodierung) sie geschrieben wurden.
Es gibt keine "Magic Numbers" anhand derer "file" irgendwas konkretes identifizieren kann. Bei HTML gibt's noch die charset-Angabe, die "file" nutzen kann ...
Das kann so - glaube ich - nicht stimmen. Irgendwie muss den Textdateien die Kodierung "anzusehen" sein.
Es würde zu weit gehen, jetzt meine Umgebung im Detail zu beschreiben.
Nur soviel: Ich habe bei meinem aktuellen projekt exakt eine html-Seite mit dem html-header (incl. meta charset...). Ich setze die Seiten mit perl und CGI::Templat zusammen, was ne Menge Erstellungs- und Pflegeaufwand spart.
PHP-Dateien sind vereinzelt vorhanden, da ich die "noch hatte".

mit file [-i] * bekomm ich ein buntes Misch-Masch von Kodierungen angeboten,was mich eben etwas verwirrt hat; z. B.:

text/plain; charset=us-ascii
text/plain; charset=iso-8859-1
text/plain; charset=unknown
text/plain; charset=utf-8
UTF-8 Unicode HTML document text
ASCII text
UTF-8 Unicode text (ist auch ein .html-Dokument)
Non-ISO extended-ASCII text

Neben den Einstellungen am Webserver muss ich jetzt meine Shell noch so einstellen, dass mein Editor mir schön brav alles als utf-8 abspeichert, dann kann das Ganze klappen.
 
Gilt das auch, wenn ich mir die Seiten nur mit dem lokalen Webserver oder nem Texteditor ansehe?
Nein, nur nach dem Download vom Server auf die Festplatte - also losgelöst vom Nutzungskontext Auslieferung durch Webserver oder Öffnen im konfigurierten Texteditor.
 
Zurück
Oben Unten