Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.
Stell doch mal einen Link zu einer Seite ein, bei der du mit dem Archivierungsergebnis unzufrieden bist.
—-
Was das Archivieren von Webinhalten angeht: Du hast hier unterschiedliche Möglichkeiten und du musst dich entscheiden, welche zu der jeweiligen Seite passt. Nicht jedes Format passt zu jeder Seite und vielleicht ist genau das das Verwirrende.
Vielleicht hilft dir mein Vorgehen: Das Meiste speichere ich als Markdown (aufgeräumt). Das Format ist schlank und kann mit einfachsten editiert bzw. weiterverwendet werden. Das Markdown-Dokument liegt dann in DT und ich kann es nachbearbeiten, d.h. ich lösche allen Kram raus, den ich nicht brauche. Das ist meist Werbung, bestimmte Zusatzinformationen oder auch Bilder, die nur der Dekoration dienen.
Was drin bleiben muss, sind Bilder, Grafiken etc., die zum Inhalt gehören - und die sind ein Problem, da sie nicht im Markdown-Dokument gespeichert, sondern nachgeladen werden. D.h. die könnten irgendwann weg sein. Deshalb konvertiere ich diese Dokumente nach der Aufräumarbeit in ein paginiertes PDF. Ggfs. füge ich vorher noch Seitenumbrüche oder Zusatzzeilen ein. Da ich das innerhalb DT mache, sehen die Ergebnisse auch immer gleich aus. Das ist viel Aufwand, der ist es mir bei bestimmten Dokumenten aber wert.
Was sich noch als aufgeräumtes Markdown-Dokument speichern lässt, wird als PDF (unaufgeräumt) oder Webarchiv gespeichert. Auch das ist nicht immer möglich, z.B. wenn ein Login erforderlich ist.
Die Speicherung selbst erfolgt über den DT-Button in Safari oder das DT-Menulet oder aber, wenn Ich nur Teile des Seiteninhalts benötige, über das Kontextmenu: Ich markiere den entsprechenden Text und speichere ich per Rechtsklick als Markdown nach DT. Der Vorteil ist, dass bei der Speicherung die Quell-URL mitgespeichert wird.
Komplette Seiten werden als Webseite über den Download-Manager heruntergeladen. In der Regel in einer Verzeichnistiefe von 3 Ebenen, alles andere würde zu umfangreich werden. Auch hier gibt es Einzelseiten, die ich dann weiterverarbeite - siehe oben.
Rechtlich relevantes wie beispielsweise eine Bestellung über Amazon muss ohnehin in einem Screenshot oder als unaufgeräumtes PDF abgelegt werden (das Webarchiv oder eine HTML-Seite ist hier völlig ungeeigne), wobei über diese Dokumente dann noch einmal eine OCR angewandt wird.