Sammelthread DEVONthink

Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.
 
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.
Eigentlich bietet DT ja schon sehr viele Möglichkeiten, die auch sehr gut umgesetzt sind. Allerdings machen einem manchmal auch die Webseiten selbst einen Strich durch die Rechnung. Ich selbst speichere die Seiten meistens als HTML-Seite. Man kann dann sogar anschließend die Seite in Grenzen editieren und Bereiche rauslöschen.
Aber was vermisst du und bei welchen Seiten hast du Probleme?
 
  • Gefällt mir
Reaktionen: Symbiose
Eigentlich bietet DT ja schon sehr viele Möglichkeiten, die auch sehr gut umgesetzt sind.
Eigentlich schon, sollte man meinen.....
Allerdings machen einem manchmal auch die Webseiten selbst einen Strich durch die Rechnung.......
Aber was vermisst du und bei welchen Seiten hast du Probleme?
Z.B. Amazon. Ich möchte die Seite meiner letzten Bestellungen archivieren.
Mache ich das mit DT, über Teilen als HTML oder PDF speichern, egal, es wird danach immer das Anmeldefenster von Amazon angezeigt.

Gehe ich über Safari, nutze ich darin "als PDF exportieren" wird mir diese Seite so gespeichert und angezeigt wie ich sie sehe.

EDIT
Mach eich das mit dieser Seite von MacUser, klappt das alles wunderbar. Speichern als HTML Seite über das Teilen Menü innerhalb von Safari, kein Problem. Und ja, ich kann diese Seite dann sogar editieren, Bereiche rauslöschen.
 
Eigentlich schon, sollte man meinen.....

Z.B. Amazon. Ich möchte die Seite meiner letzten Bestellungen archivieren.
Mache ich das mit DT, über Teilen als HTML oder PDF speichern, egal, es wird danach immer das Anmeldefenster von Amazon angezeigt.

Gehe ich über Safari, nutze ich darin "als PDF exportieren" wird mir diese Seite so gespeichert und angezeigt wie ich sie sehe.
Das wird daran liegen, dass DT einen eigenen Browser verwendet, auf jeden Fall die Safari Session nicht nutzt und somit Amazon eine Anmeldung verlangt, weil kein angemeldeter User im die Ecke kommt.
 
  • Gefällt mir
Reaktionen: BEASTIEPENDENT
Ich besitze auch DEVONthink 3 Pro und habe im Nachhinein festgestellt, dass das Programm für meinen Anwendungsbereich zu viele (vermutlich tolle) Features verfügt, die ich entweder gar nicht benötige oder einfach zu kompliziert umgesetzt sind. Eigentlich wollte ich mich mit DT anfreunden und ich habe auch einiges an Zeit hineingesteckt, aber leider hat das für mich nicht so richtig funktioniert. Letztlich bin ich für meinen Anwendungsfall bei EagleFiler gelandet und bekomme dort mit einfacheren Workflows zum Ziel um Websites (und das funktioniert sogar) oder jegliche Art von Dokumenten abzulegen. Vielleicht ist es für @Symbiose auch eine bessere Alternative.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Symbiose
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

Liegt meistens am OSI Layer 8
 
  • Gefällt mir
  • Haha
  • Traurig
Reaktionen: troubadix2004, Symbiose und BSDheld
Ich besitze auch DEVONthink 3 Pro und habe im Nachhinein festgestellt, dass das Programm für meinen Anwendungsbereich zu viele (vermutlich tolle) Features verfügt, die ich entweder gar nicht benötige oder einfach zu kompliziert umgesetzt sind.
Komme auch stellenweise zu dieser Wahrnehmung.
Habe es trotzdem gekauft (Pro) weil ich der Meinung war/bin, das ich möglicherweise eines Tages DT umfangreicher nutzen werde, oder die darin enthaltenen Möglichkeiten für meinen Workflow besser erkenne und umsetzen kann.
Eigentlich wollte ich mich mit DT anfreunden und ich habe auch einiges an Zeit hineingesteckt, aber leider hat das für mich nicht so richtig funktioniert.
Ja, ich erkenne mich darin ein Stück weit wieder.
Letztlich bin ich für meinen Anwendungsfall bei EagleFiler gelandet und bekomme dort mit einfacheren Workflows zum Ziel um Websites (und das funktioniert sogar) oder jegliche Art von Dokumenten abzulegen. Vielleicht ist es für @Symbiose auch eine bessere Alternative.
Ich habe mir dieses Programm leider nur sehr oberflächlich angeschaut, habe es aber erneut auf dem Schirm. Danke.

EDIT:
Gerade nochmals kur den EagleFiler installiert.
Doch auch damit habe ich die gleichen Herausforderungen wie bei DT, also keine Verbesserung. Dann bleibe ich letztlich lieber bei DT und arrangiere mich damit - bevor ich mich zu sehr in verschiedene Anwendungen verlaufe.
 
Zuletzt bearbeitet:
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

Stell doch mal einen Link zu einer Seite ein, bei der du mit dem Archivierungsergebnis unzufrieden bist.

—-

Was das Archivieren von Webinhalten angeht: Du hast hier unterschiedliche Möglichkeiten und du musst dich entscheiden, welche zu der jeweiligen Seite passt. Nicht jedes Format passt zu jeder Seite und vielleicht ist genau das das Verwirrende.

Vielleicht hilft dir mein Vorgehen: Das Meiste speichere ich als Markdown (aufgeräumt). Das Format ist schlank und kann mit einfachsten editiert bzw. weiterverwendet werden. Das Markdown-Dokument liegt dann in DT und ich kann es nachbearbeiten, d.h. ich lösche allen Kram raus, den ich nicht brauche. Das ist meist Werbung, bestimmte Zusatzinformationen oder auch Bilder, die nur der Dekoration dienen.

Was drin bleiben muss, sind Bilder, Grafiken etc., die zum Inhalt gehören - und die sind ein Problem, da sie nicht im Markdown-Dokument gespeichert, sondern nachgeladen werden. D.h. die könnten irgendwann weg sein. Deshalb konvertiere ich diese Dokumente nach der Aufräumarbeit in ein paginiertes PDF. Ggfs. füge ich vorher noch Seitenumbrüche oder Zusatzzeilen ein. Da ich das innerhalb DT mache, sehen die Ergebnisse auch immer gleich aus. Das ist viel Aufwand, der ist es mir bei bestimmten Dokumenten aber wert.

Was sich noch als aufgeräumtes Markdown-Dokument speichern lässt, wird als PDF (unaufgeräumt) oder Webarchiv gespeichert. Auch das ist nicht immer möglich, z.B. wenn ein Login erforderlich ist.

Die Speicherung selbst erfolgt über den DT-Button in Safari oder das DT-Menulet oder aber, wenn Ich nur Teile des Seiteninhalts benötige, über das Kontextmenu: Ich markiere den entsprechenden Text und speichere ich per Rechtsklick als Markdown nach DT. Der Vorteil ist, dass bei der Speicherung die Quell-URL mitgespeichert wird.

Komplette Seiten werden als Webseite über den Download-Manager heruntergeladen. In der Regel in einer Verzeichnistiefe von 3 Ebenen, alles andere würde zu umfangreich werden. Auch hier gibt es Einzelseiten, die ich dann weiterverarbeite - siehe oben.

Rechtlich relevantes wie beispielsweise eine Bestellung über Amazon muss ohnehin in einem Screenshot oder als unaufgeräumtes PDF abgelegt werden (das Webarchiv oder eine HTML-Seite ist hier völlig ungeeigne), wobei über diese Dokumente dann noch einmal eine OCR angewandt wird.
 
  • Gefällt mir
Reaktionen: Symbiose
Clip doch einfach in DT.
Command-C Safari Adresse
Command-N in DT.
Einloggen. Shoppen.
Mit Rechtsklick Seite erfassen den Kram sichern.
Du kannst auch aus der gesicherten PDF weitersurfen und andere Seiten sichern.
DT hat einen dynamischen Browser. Das Ausgangsformat ist dabei egal.
 
  • Gefällt mir
Reaktionen: BEASTIEPENDENT und Symbiose
Ich weiß nicht einmal, um was es sich dabei handelt. :noplan:
Das OSI-Modell hat 7 Layer, von 1, der Hardware bis 7, der Application. Layer 8 ist also eine andere Bezeichnung für 50cm Problem, es sitzt vor dem Bildschirm.
Das ist nur eine Beschreibung, keine Wertung von mir.
 
  • Gefällt mir
  • Wow
Reaktionen: BEASTIEPENDENT und Symbiose
Clip doch einfach in DT.
Command-C Safari Adresse
Command-N in DT.
Einloggen. Shoppen.
Mit Rechtsklick Seite erfassen den Kram sichern.
Du kannst auch aus der gesicherten PDF weitersurfen und andere Seiten sichern.
DT hat einen dynamischen Browser. Das Ausgangsformat ist dabei egal.
Na prima, das klappt.

Mit
Mit Rechtsklick Seite erfassen
geht es einwandfrei.

Würde ich in dieser DT Browser Seite über "Teilen" gehen, dann nicht.

Aber das ist wenigstens eine Möglichkeit.
 
  • Gefällt mir
Reaktionen: mafr22 und BEASTIEPENDENT
Was das Archivieren von Webinhalten angeht: Du hast hier unterschiedliche Möglichkeiten und du musst dich entscheiden, welche zu der jeweiligen Seite passt. Nicht jedes Format passt zu jeder Seite und vielleicht ist genau das das Verwirrende.

Vielleicht hilft dir mein Vorgehen: Das Meiste speichere ich als Markdown (aufgeräumt). Das Format ist schlank und kann mit einfachsten editiert bzw. weiterverwendet werden. Das Markdown-Dokument liegt dann in DT und ich kann es nachbearbeiten, d.h. ich lösche allen Kram raus, den ich nicht brauche. Das ist meist Werbung, bestimmte Zusatzinformationen oder auch Bilder, die nur der Dekoration dienen.
Das habe ich gerade versucht umzusetzen.

Seltsam daran ist allerdings, dass ich immer nur einen kleinen Teil der Seite und zwar genau dieser Seite hier, in der Vorschau und nach dem speichern erhalte. Und zwar immer den selben, niemals die gesamte Seite.


Ich selbst speichere die Seiten meistens als HTML-Seite. Man kann dann sogar anschließend die Seite in Grenzen editieren und Bereiche rauslöschen.
Ich denke, das dies die noch praktikabelste Lösung für mich persönlich darstellt, um eine Webseite, so wie ich sie sehe, dauerhaft zu archivieren und sogar zu bearbeiten. D.h., überflüssiges daraus entfernen.

Oder halt einfach, wie ich es bislang gemacht habe, per Safari einfach als PDF exportieren, denn das klappt praktisch narrensicher.
 
Zuletzt bearbeitet:
Guten Tag,

das leidige Thema, denn ich weiß mir keinen Rat.

Ich nutzt nun die DT 3 Pro Version. Habe darin lediglich 2 PDF Ordner indiziert.

Wenn ich nun in der Systemeinstellung des Mac schaue und mir anzeigen lassen, wie hoch der Datrenverbrauch bei den Dokumenten ist, wird mir dort angezeigt: Siehe Screenshot

Warum ist der Datenverbrauch dort so hoch, obwohl sie doch nur indiziert sind?

Gehe ich in DT in die jeweilige Datenbank und lasse mit die Informationen dazu anzeigen, lese ich:

Eigene Datenbank DT indiziert: 18.665 Objekte - 15,4 GB
Eigene Datenbank DT: 69 Objekte - 57,9 MB - und in der Systemeinstellung wird mit 980 MB angezeigt.

Ich verstehe das nicht, das DT derart viel Speicher verbraucht.
Obwohl doch nur bei der einen DT indiziert wurde.
 

Anhänge

  • Bildschirmfoto 2023-12-04 um 07.39.39.png
    Bildschirmfoto 2023-12-04 um 07.39.39.png
    41,8 KB · Aufrufe: 50
Wieviel Speicher wird dir denn angezeigt, wenn du im Finder mit Command - I auf die Datenbank klickst?
 
Wieviel Speicher wird dir denn angezeigt, wenn du im Finder mit Command - I auf die Datenbank klickst?

Im Finder wird mir angezeigt:

Bei der indizierten Datenbank: 1,38 GB
Bei der nicht indizierten Datenbank: 929 MB

Wobei die tatsächliche Größe der Ordner, die ich indiziert habe, 14,52 GB beträgt.

Ist es normal, dass dann die Größe der DT Datenbank bei einer Indizierung tatsächlich1,38 GB beträgt?

Wie gesagt, ich möchte es verstehen und nachvollziehen können.
Vor allem möchte ich wissen, ob das so stimmig ist.

Vielen Dank.
 
Zurück
Oben Unten