maceis
Aktives Mitglied
Thread Starter
- Dabei seit
- 24.09.2003
- Beiträge
- 16.880
- Reaktionspunkte
- 626
Hallo zusammen,
ich habe die Betreuung einer Website übernommen, die innerhalb von Jahren gewachsen ist. Die einzelnen Seiten werden mithilfe von Templates über CGI Skripte (Perl) und unter Verwendung einer MySQL Datenbank gebaut und ausgeliefert. In geringem Umfang wird Javascript verwendet. Die Seite ist zudem mehrsprachig (Deutsch, Englisch, Holländisch) und hat eine Portalseite mit zwei untergeordneten "Zweigen".
Die Seite ist über Jahre gewachsen, immer wieder "auf die Schnelle" erweitert worden und insgesamt ist im Lauf der Zeit ein ganz schöner Wust an Dateien entstanden. Insgesamt sind es knapp 400 Dateien.
Meine Frage:
Wie bringt man da wieder Ordnung rein?
Im ersten Schritt, würde es schon helfen, die Dateien herauszufinden, auf die gar nicht mehr zugegriffen wird, weil sie von keinem Skript und keinem Template mehr aufgerufen werden. Die könnte man dann wegsichern, was das "Aufräumen" des Restes sicherlich erleichtern würde. Ein Backup ist selbstverständlich vorhanden.
Gibt es für so eine Aufgabe irgendwelche Konzepte oder Hilfsmittel?
Mein erster Denkansatz geht dahin, dass man eine Art Webcrawler durch die Seite laufen lässt, der rekursiv alle links aufruft.
Anschließend könnte man mit den Hilfsmitteln der Shell alle Dateien finden, auf die, sagen wir mal innerhalb der letzten 10 Minuten, zugegriffen wurde.
Aber vielleicht gibt es da ja auch einfachere Lösungen.
Danke im Voraus und Gruß
maceis
ich habe die Betreuung einer Website übernommen, die innerhalb von Jahren gewachsen ist. Die einzelnen Seiten werden mithilfe von Templates über CGI Skripte (Perl) und unter Verwendung einer MySQL Datenbank gebaut und ausgeliefert. In geringem Umfang wird Javascript verwendet. Die Seite ist zudem mehrsprachig (Deutsch, Englisch, Holländisch) und hat eine Portalseite mit zwei untergeordneten "Zweigen".
Die Seite ist über Jahre gewachsen, immer wieder "auf die Schnelle" erweitert worden und insgesamt ist im Lauf der Zeit ein ganz schöner Wust an Dateien entstanden. Insgesamt sind es knapp 400 Dateien.
Meine Frage:
Wie bringt man da wieder Ordnung rein?
Im ersten Schritt, würde es schon helfen, die Dateien herauszufinden, auf die gar nicht mehr zugegriffen wird, weil sie von keinem Skript und keinem Template mehr aufgerufen werden. Die könnte man dann wegsichern, was das "Aufräumen" des Restes sicherlich erleichtern würde. Ein Backup ist selbstverständlich vorhanden.
Gibt es für so eine Aufgabe irgendwelche Konzepte oder Hilfsmittel?
Mein erster Denkansatz geht dahin, dass man eine Art Webcrawler durch die Seite laufen lässt, der rekursiv alle links aufruft.
Anschließend könnte man mit den Hilfsmitteln der Shell alle Dateien finden, auf die, sagen wir mal innerhalb der letzten 10 Minuten, zugegriffen wurde.
Aber vielleicht gibt es da ja auch einfachere Lösungen.
Danke im Voraus und Gruß
maceis
Zuletzt bearbeitet: