Umlaute in Textdateien für ne DB

macddict

Aktives Mitglied
Thread Starter
Dabei seit
20.02.2005
Beiträge
209
Reaktionspunkte
5
Hallo zusammen,

folgendes Problem:
Will ein kleines CMS bauen und die Texte der Webseite in externe Dateien auslagern. Wie ist das nun mit den Umlauten? Soll ich die schon in den Dateien mit ü usw speichern oder lieber erst immer zur Laufzeit konvertieren?

Ich denke wenn ich die Text in der Datenbank speicher habe ich das gleiche Problem..
 
So etwas macht man in der Business-/Präsentationsschicht und nicht in der Persistenzschicht, wenn man es korrekt machen will. Schliesslich könnte ja auch ein anderer, nicht HTML-Client, die Daten nutzen wollen. Also, DB mit UTF-8 konfigurieren und in die Ausgabe konvertiert die Daten.

Solange Du aber die Daten für nichts anderes verwendest, ist es im Endeffekt egal.
 
Wenn der Webserver richtig konfiguriert ist, kann man Umlaute ganz normal verwenden, so wie man sie auch in einm normalen Text schreiben würde..
Gab schon mal eine intensive Diskussion zu dem Thema hier.
 
danke für die infos..mir ist grad aufgefallen das mein post wohl in den thread 'webentwicklung' passt. :D
 
Konvertierung bei der Ausgabe ist anzuraten. Wenn der Redakteur die Texte ändern will sollte er das zu sehen bekommen was er vormals eingegeben hat und nicht irgendwelches Kauderwelsch.
 
Wie meinst Du das, dms?

Ich würde dazu raten, die Texte so einzugeben und zu verarbeiten, wie man das auch mit normalen Dateien macht.
In Deutschland heisst das, dass man Umlaute, ß etc. als solche schreibt und nicht als entities.
Dan brauche ich aber keine Konvertierung bei der Ausgabe (vorausgesetzt der Webserver ist richtig konfiguriert).
 
Klar, Konvertierung natürlich nur wenn es auch sinnvoll ist. Falls ich mich so missverständlich ausgedrückt habe hier nochmal anders: :)

Der Redakteur sollte beim Editieren des Textes das sehen was er auch versteht bzw. vorher eingegeben hat. Falls eine Konvertierung stattfindet, dann sollte sie beim Erstellen der Seite und nicht beim Speichern des Inhaltes stattfinden, sonst hat er überall ä stehen wo er vormals ä eingegeben hat.
Natürlich könnte man beim Editieren wieder alle Zeichen zurückwandeln. Sowas ist aber hässlich. Man sollte immer die tatsächliche Nutzereingabe speichern um auch eventuellen zukünftigen Änderungen gewachsen zu sein. Wenn man z.B. den Charset ändert hat man überall unnötige Entitäten im Inhalt.
Beispiel für BB-Code: Man will das Tag
Code:
 in [script] ändern. Würde der umgewandelte Text in der Datenbank liegen wäre eine Änderung aller bisherigen Beiträge um einiges aufwändiger.
 
Ich dachte die enties werden eher für die client also browser gemacht und nicht für den webserver. D.h. wenn ich die Umlaute einfach im Text lasse (ohne entities) wird es u.U. bei einigen Browsern/System falsch dargestellt..?
 
maceis schrieb:
Dan brauche ich aber keine Konvertierung bei der Ausgabe (vorausgesetzt der Webserver ist richtig konfiguriert).

kann aber auch sein das ich das irgendwie falsch verstanden haben...auf jeden fall danke für all die infos :D
 
maceis meinte damit wahrscheinlich dass der Webserver den korrekten Zeichensatz ausgiebt. Den Apache kann man z.B. dahingehend beeinflussen welcher Zeichensatz (Charset) als Standard dem Browser übermittelt werden soll. In bestimmten Zeichensätzen, in denen Umlaute definiert sind, ist eine Konvertierung nicht nötig.
 
Zurück
Oben Unten