Wie extrahiere ich HTML-Code?

C

Chilly_Bang

Neues Mitglied
Thread Starter
Dabei seit
10.06.2004
Beiträge
16
Reaktionspunkte
0
Hallo an alle!
ich bin auf der Suche nach einer schnellen Methode, wie ich eine HTML-Datei in zwei Teile trenne: ein Teil mit reinem HTML-Code, zweites Teil - reines Text?
dank schon mal:))
 
Hä?
HTML-Code -> Seitenquelltext anzeigen lassen.
reiner text -> Copy & Paste der Seitenansicht im Browser
 
manuelle methode kommt nicht in frage, leider:(:(:( zu viel text...außerdem steht text nicht nur als artikel, sondern auch in den php-dienstmeldungen usw...cu&paste wäre ja ganz schööön und einfach - ist aber zu zeitintensiv und unsicher (dass ich vielleicht etwas zufällig auslasse...
 
warum druckst du den kram nicht als pdf aus? dann kannst du den text auch aus der vorschau kopieren...
 
Vielleicht solltest du etwas genauer erläutern, was und in welchem Umfang du genau machen möchstest. Ich habe jedenfalls noch nicht richtig verstanden, was du eigentlich vorhast.
 
Versuchs mal mit xml & xsd ...
 
Chilly_Bang schrieb:
ich bin auf der Suche nach einer schnellen Methode, wie ich eine HTML-Datei in zwei Teile trenne: ein Teil mit reinem HTML-Code, zweites Teil - reines Text?

Eine Handvoll regulärer Ausdrücke sollte dafür ausreichen.

Matt
 
folgendes Anliegen: es muss eine sehr umfangreiche seite lokalisiert werden (sehr sehr viel text).

was ich bestrebe: quelldatei wird entzweit:
erste datei, beinhaltet reines Code mit markierten Orten wo der Text stand, zweite datei, beinhaltet reines Text mit info, aus welcher Stelle der Quelldatei der Text kommt....dann wird der Text übersetzt und anhand der Markierungen wieder in die Quelldatei eingefügt.
 
Chilly_Bang schrieb:
folgendes Anliegen: es muss eine sehr umfangreiche seite lokalisiert werden (sehr sehr viel text).

was ich bestrebe: quelldatei wird entzweit:
erste datei, beinhaltet reines Code mit markierten Orten wo der Text stand, zweite datei, beinhaltet reines Text mit info, aus welcher Stelle der Quelldatei der Text kommt....dann wird der Text übersetzt und anhand der Markierungen wieder in die Quelldatei eingefügt.
Hm, ja, dann würde ich das per RegEx machen: Text filtern und durch Platzhalter ersetzen. Aber sinnvoller wäre meiner Meinung nach eine XML- oder datenbankbasierte Lösung. Das ist insgesamt weitaus dynamischer.
 
Die Texte müssen ja nicht unbedingt in einer Datenbank stehen.

Normalerweise macht man's so, dass man anstatt der Texte eine Variable einsetzt und den Text dann in einer Sprachdatei hinterlegt. In der "globalen" Config-Datei sollte dann die Sprache ausgewählt werden, um die korrekte (lokalte) Datei einzulesen. Also z.B. de.php oder en.php. So kann man jede Sprache wunderbar pflegen.
 
Zurück
Oben Unten