maceis
Aktives Mitglied
Thread Starter
- Dabei seit
- 24.09.2003
- Beiträge
- 16.880
- Reaktionspunkte
- 626
Das kann so - glaube ich - nicht stimmen. Irgendwie muss den Textdateien die Kodierung "anzusehen" sein.?=? schrieb:"file" kann's den bytes halt nicht ansehen mit welcher Absicht (=welcher Kodierung) sie geschrieben wurden.
Es gibt keine "Magic Numbers" anhand derer "file" irgendwas konkretes identifizieren kann. Bei HTML gibt's noch die charset-Angabe, die "file" nutzen kann ...
Es würde zu weit gehen, jetzt meine Umgebung im Detail zu beschreiben.
Nur soviel: Ich habe bei meinem aktuellen projekt exakt eine html-Seite mit dem html-header (incl. meta charset...). Ich setze die Seiten mit perl und CGI::Templat zusammen, was ne Menge Erstellungs- und Pflegeaufwand spart.
PHP-Dateien sind vereinzelt vorhanden, da ich die "noch hatte".
mit file [-i] * bekomm ich ein buntes Misch-Masch von Kodierungen angeboten,was mich eben etwas verwirrt hat; z. B.:
text/plain; charset=us-ascii
text/plain; charset=iso-8859-1
text/plain; charset=unknown
text/plain; charset=utf-8
UTF-8 Unicode HTML document text
ASCII text
UTF-8 Unicode text (ist auch ein .html-Dokument)
Non-ISO extended-ASCII text
Neben den Einstellungen am Webserver muss ich jetzt meine Shell noch so einstellen, dass mein Editor mir schön brav alles als utf-8 abspeichert, dann kann das Ganze klappen.