Html-Seiten bereinigen

WirbelFCM

WirbelFCM

Aktives Mitglied
Thread Starter
Dabei seit
24.01.2008
Beiträge
7.337
Reaktionspunkte
819
Hallo,

Ich Suche ein Tool, um "aufgeblähte" Html-Seiten zu bereinigen, also nur auf den wesentlichen Html-Code und den unnötigen Schnickschnack zu entfernen.

Weiß jemand Rat?

Thx!
 
Das geht doch mit einem editor besser.Vor allem weißt du dann was du entfernt hast.Ich such die unnötigen sachen in Quellcode selber um sie zu entfernen.
 
"per Hand" ist aber leider keine Option :(

"tidy" eben so wenig - das bläht die Seite auf das Fünffache (!) auf!!! :eek:

Aber trotzdem Danke für die Hinweise ;)
 
Was ist denn genau das Problem bei den Seiten? "CMS-Problematik"? Also überflüssige und doppelte Tags nach der Bearbeitung wie z.B. <p><p><div>... oder sind die Seiten mit einem WYSIWYG Editor erstellt und deshalb nicht optimiert?
 
Was ist denn genau das Problem bei den Seiten? "CMS-Problematik"? Also überflüssige und doppelte Tags nach der Bearbeitung wie z.B. <p><p><div>... oder sind die Seiten mit einem WYSIWYG Editor erstellt und deshalb nicht optimiert?


Ich gehe mal von Letzterem aus :D

Neben ellenlangen META-Tags tonnenweise "Programmierer-Kommentare am Ende jeder Zeile etc.

Und wenn jemand einen Weg kennen sollte, wie man Werbung (Banner, Flash-Animationen etc.) automatisch (!) erkennen lassen und entfernen kann, wäre das ideal :p
 
Ah, ok. Dann wird es schwierig. Sehr sogar. Jedenfalls was eine automatische Bereinigung angeht.
 
Hmmm, echt?? Es gibt doch sogar schon Programme, die aus Mac-Programmen den unnötigen Code entfernen :(

Da dürfte das mit HTML-Code doch eigentlich kein Prob sein, oder?
 
Naja, unnötigen Code kannst du theoretisch schon mit Editoren wie Dreamweaver halbwegs automatisiert entfernen. Da ist aber durchaus ein bisschen Vorarbeit und Analyse notwendig.

Das Problem ist schlicht, dass HTML dem Programmierer ziemlich freie Hand lässt, wie er den Weg zur entsprechenden Anzeige gestaltet. Ob div oder p oder Tabellenelement ist erstmal egal, wenn es darum geht einen Block mit Text zu füllen.

Zwischen div und p gibt es große Unterschiede. Beide haben unterschiedliche Zielsetzungen und sind in der HTML-Hierarchie anders eingebunden. Um diese Zielsetzung optimal zu nutzen, musst du aber den Quelltext programmieren und für den passenden Anwendungsfall im Dokument das passende Element auswählen.

Und hier ergibt sich das Problem der WYSIWYG Editoren. Der Editor kann nicht erkennen, was du mit dem Einfügen eines Textelements erreichen willst. Willst du ein Blockelement oder willst du Fließtext (der möglicherweise innerhalb eines Blockelements steht).

Und genauso verhält sich der WYSIWYG Editor. Er tut, was er meint, basierend auf simplen Regeln. Das geht aber viel zu oft schief, weil die doch recht komplexe Überlegung, die hinter dem DOM steht, eben nicht mit ein paar einfachen Regeln abgedeckt werden kann.

Kurz: HTML sieht erstmal einfach aus, hat aber eine sehr durchdachte Struktur. Da kommt ein grafischer Editor nicht mit. Da hilfen nur fundierte Kenntnisse.

Soviel zur Theorie.

In der Praxis könntest du dir die Seiten ansehen und versuchen, ein Schema zu finden, das du durch ein anderes ersetzen kannst. Wenn in jeder Seite derselbe (oder ein ähnlicher) Seitenkopf zu finden ist (so löse ich das bei meinen Seiten), kannst du den ggf. ersetzen.

Eine Standardseite bei mir sieht etwa so aus:

- Head (in der Regel für bestimmte Bereiche der Website gleich)
- Grundgerüst für das Layout oben
- Inhaltsdiv mit dem Seiteninhalt
- Grundgerüst für das Layout unten
- Seitenfuß

Wenn ich das Layout ändere, kann ich mir also eine Vorlage erstellen, in die dann das Inhaltsdiv hineinkopiert wird.

Aber letztlich hängt das immer vom Einzelfall ab. Ich kann das nur beurteilen, wenn ich so eine Seite mal gesehen hab. Und dem Bereinigungstool geht das nicht anders. ;)
 
Und wenn jemand einen Weg kennen sollte, wie man Werbung (Banner, Flash-Animationen etc.) automatisch (!) erkennen lassen und entfernen kann, wäre das ideal :p

Also, normalerweise erscheint nicht irgend welche Werbung auf deiner Homepage. Die musst du selber eingebunden haben.

Ich habe aber einen Verdacht: geht es vielleicht um Webspace auf einen Gratis-Anbieter, der (als Teil der AGB) Werbung einbindet? Dann kannst du (darfst du!) nix daran machen.
 
Nein, nein. Es geht um nichts dergleichen!

Es geht um den "Datentrash", der speziell in mittels Windows-Web-Editoren programmierten Webseiten versteckt ist. Wenn Du bspw. eine Webseite in HTML in einem Texteditor selber programmierst (also mittels HTML-Code), hat diese Seite nur eine Größe von ein paar kB. Erstellst Du die gleiche Seite (also mit dem gleichen Inhalt) allerdings mit einem Webeditor, hat diese Seite eine Dateigröße von vielen MB, ist also um ein Vielfaches größer, obwohl der User zwei "identische" Seiten zu sehen bekommt. Dieser zusätzliche "Spam-Code", den solche Editoren gerne produzieren und der zur Darstellung oder Funktion der besagten Seite gar nichts beiträgt, soll aus eben solchen Seiten automatisch entfernt werden.
 
Hab ich neulich auch erst gefunden, wollte ich eigentlich hier auch noch posten.. Kennst du den Google Mobilizer? http://www.google.com/gwt/n

Die Jungs sind irgendwie immer eine Nasenlänge voraus. :hehehe:
 
Also das mit der Werbung kommt mir immernoch illegal vor aber ich arbeite als Demo an einem Programm was dies blauen Sponsorads wegmacht

Und bei diesem mist mit den webeditoren fang einfach von vorne an dn mit Automatisierung kommst du bei Komplexen Seiten nicht weit
 
Zurück
Oben Unten