Sammelthread DEVONthink

Symbiose · 29.11.2023

Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

rudluc · 29.11.2023

Symbiose schrieb:
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

Eigentlich bietet DT ja schon sehr viele Möglichkeiten, die auch sehr gut umgesetzt sind. Allerdings machen einem manchmal auch die Webseiten selbst einen Strich durch die Rechnung. Ich selbst speichere die Seiten meistens als HTML-Seite. Man kann dann sogar anschließend die Seite in Grenzen editieren und Bereiche rauslöschen.
Aber was vermisst du und bei welchen Seiten hast du Probleme?

Symbiose · 29.11.2023

rudluc schrieb:
Eigentlich bietet DT ja schon sehr viele Möglichkeiten, die auch sehr gut umgesetzt sind.

Eigentlich schon, sollte man meinen.....

rudluc schrieb:
Allerdings machen einem manchmal auch die Webseiten selbst einen Strich durch die Rechnung.......
Aber was vermisst du und bei welchen Seiten hast du Probleme?

Z.B. Amazon. Ich möchte die Seite meiner letzten Bestellungen archivieren.
Mache ich das mit DT, über Teilen als HTML oder PDF speichern, egal, es wird danach immer das Anmeldefenster von Amazon angezeigt.

Gehe ich über Safari, nutze ich darin "als PDF exportieren" wird mir diese Seite so gespeichert und angezeigt wie ich sie sehe.

EDIT
Mach eich das mit dieser Seite von MacUser, klappt das alles wunderbar. Speichern als HTML Seite über das Teilen Menü innerhalb von Safari, kein Problem. Und ja, ich kann diese Seite dann sogar editieren, Bereiche rauslöschen.

BSDheld · 29.11.2023

Symbiose schrieb:
Eigentlich schon, sollte man meinen.....

Z.B. Amazon. Ich möchte die Seite meiner letzten Bestellungen archivieren.
Mache ich das mit DT, über Teilen als HTML oder PDF speichern, egal, es wird danach immer das Anmeldefenster von Amazon angezeigt.

Gehe ich über Safari, nutze ich darin "als PDF exportieren" wird mir diese Seite so gespeichert und angezeigt wie ich sie sehe.

Das wird daran liegen, dass DT einen eigenen Browser verwendet, auf jeden Fall die Safari Session nicht nutzt und somit Amazon eine Anmeldung verlangt, weil kein angemeldeter User im die Ecke kommt.

Gartentaucher · 29.11.2023

Ich besitze auch DEVONthink 3 Pro und habe im Nachhinein festgestellt, dass das Programm für meinen Anwendungsbereich zu viele (vermutlich tolle) Features verfügt, die ich entweder gar nicht benötige oder einfach zu kompliziert umgesetzt sind. Eigentlich wollte ich mich mit DT anfreunden und ich habe auch einiges an Zeit hineingesteckt, aber leider hat das für mich nicht so richtig funktioniert. Letztlich bin ich für meinen Anwendungsfall bei EagleFiler gelandet und bekomme dort mit einfacheren Workflows zum Ziel um Websites (und das funktioniert sogar) oder jegliche Art von Dokumenten abzulegen. Vielleicht ist es für @Symbiose auch eine bessere Alternative.

mafr22 · 29.11.2023

Symbiose schrieb:
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

Liegt meistens am OSI Layer 8

Symbiose · 29.11.2023

mafr22 schrieb:
Liegt meistens am OSI Layer 8

Dann ist alles klar

Symbiose · 29.11.2023

Gartentaucher schrieb:
Ich besitze auch DEVONthink 3 Pro und habe im Nachhinein festgestellt, dass das Programm für meinen Anwendungsbereich zu viele (vermutlich tolle) Features verfügt, die ich entweder gar nicht benötige oder einfach zu kompliziert umgesetzt sind.

Komme auch stellenweise zu dieser Wahrnehmung.
Habe es trotzdem gekauft (Pro) weil ich der Meinung war/bin, das ich möglicherweise eines Tages DT umfangreicher nutzen werde, oder die darin enthaltenen Möglichkeiten für meinen Workflow besser erkenne und umsetzen kann.

Gartentaucher schrieb:
Eigentlich wollte ich mich mit DT anfreunden und ich habe auch einiges an Zeit hineingesteckt, aber leider hat das für mich nicht so richtig funktioniert.

Ja, ich erkenne mich darin ein Stück weit wieder.

Gartentaucher schrieb:
Letztlich bin ich für meinen Anwendungsfall bei EagleFiler gelandet und bekomme dort mit einfacheren Workflows zum Ziel um Websites (und das funktioniert sogar) oder jegliche Art von Dokumenten abzulegen. Vielleicht ist es für @Symbiose auch eine bessere Alternative.

Ich habe mir dieses Programm leider nur sehr oberflächlich angeschaut, habe es aber erneut auf dem Schirm. Danke.

EDIT:
Gerade nochmals kur den EagleFiler installiert.
Doch auch damit habe ich die gleichen Herausforderungen wie bei DT, also keine Verbesserung. Dann bleibe ich letztlich lieber bei DT und arrangiere mich damit - bevor ich mich zu sehr in verschiedene Anwendungen verlaufe.

bin_ichs? · 29.11.2023

Symbiose schrieb:
Das sichern, oder einfache speichern einer Webseite (nur das was ich aktuell sehe) ist scheinbar nicht so einfach, wie erhofft. alles versucht, nichts klappt so richtig gut, oder so richtig unkompliziert.

Stell doch mal einen Link zu einer Seite ein, bei der du mit dem Archivierungsergebnis unzufrieden bist.

—-

Was das Archivieren von Webinhalten angeht: Du hast hier unterschiedliche Möglichkeiten und du musst dich entscheiden, welche zu der jeweiligen Seite passt. Nicht jedes Format passt zu jeder Seite und vielleicht ist genau das das Verwirrende.

Vielleicht hilft dir mein Vorgehen: Das Meiste speichere ich als Markdown (aufgeräumt). Das Format ist schlank und kann mit einfachsten editiert bzw. weiterverwendet werden. Das Markdown-Dokument liegt dann in DT und ich kann es nachbearbeiten, d.h. ich lösche allen Kram raus, den ich nicht brauche. Das ist meist Werbung, bestimmte Zusatzinformationen oder auch Bilder, die nur der Dekoration dienen.

Was drin bleiben muss, sind Bilder, Grafiken etc., die zum Inhalt gehören - und die sind ein Problem, da sie nicht im Markdown-Dokument gespeichert, sondern nachgeladen werden. D.h. die könnten irgendwann weg sein. Deshalb konvertiere ich diese Dokumente nach der Aufräumarbeit in ein paginiertes PDF. Ggfs. füge ich vorher noch Seitenumbrüche oder Zusatzzeilen ein. Da ich das innerhalb DT mache, sehen die Ergebnisse auch immer gleich aus. Das ist viel Aufwand, der ist es mir bei bestimmten Dokumenten aber wert.

Was sich noch als aufgeräumtes Markdown-Dokument speichern lässt, wird als PDF (unaufgeräumt) oder Webarchiv gespeichert. Auch das ist nicht immer möglich, z.B. wenn ein Login erforderlich ist.

Die Speicherung selbst erfolgt über den DT-Button in Safari oder das DT-Menulet oder aber, wenn Ich nur Teile des Seiteninhalts benötige, über das Kontextmenu: Ich markiere den entsprechenden Text und speichere ich per Rechtsklick als Markdown nach DT. Der Vorteil ist, dass bei der Speicherung die Quell-URL mitgespeichert wird.

Komplette Seiten werden als Webseite über den Download-Manager heruntergeladen. In der Regel in einer Verzeichnistiefe von 3 Ebenen, alles andere würde zu umfangreich werden. Auch hier gibt es Einzelseiten, die ich dann weiterverarbeite - siehe oben.

Rechtlich relevantes wie beispielsweise eine Bestellung über Amazon muss ohnehin in einem Screenshot oder als unaufgeräumtes PDF abgelegt werden (das Webarchiv oder eine HTML-Seite ist hier völlig ungeeigne), wobei über diese Dokumente dann noch einmal eine OCR angewandt wird.

bin_ichs? · 29.11.2023

Symbiose schrieb:
Dann ist alles klar

Das mit dem OSI-Layer-8-Problem würde ich ihm übel nehmen.

mafr22 · 29.11.2023

Clip doch einfach in DT.
Command-C Safari Adresse
Command-N in DT.
Einloggen. Shoppen.
Mit Rechtsklick Seite erfassen den Kram sichern.
Du kannst auch aus der gesicherten PDF weitersurfen und andere Seiten sichern.
DT hat einen dynamischen Browser. Das Ausgangsformat ist dabei egal.

Symbiose · 29.11.2023

bin_ichs? schrieb:
Das mit dem OSI-Layer-8-Problem würde ich ihm übel nehmen.

Ich weiß nicht einmal, um was es sich dabei handelt. :noplan:

bin_ichs? · 29.11.2023

Symbiose schrieb:
Ich weiß nicht einmal, um was es sich dabei handelt.

Ist besser so.

BSDheld · 29.11.2023

Symbiose schrieb:
Ich weiß nicht einmal, um was es sich dabei handelt.

Das OSI-Modell hat 7 Layer, von 1, der Hardware bis 7, der Application. Layer 8 ist also eine andere Bezeichnung für 50cm Problem, es sitzt vor dem Bildschirm.
Das ist nur eine Beschreibung, keine Wertung von mir.

Symbiose · 29.11.2023

bin_ichs? schrieb:
Das mit dem OSI-Layer-8-Problem würde ich ihm übel nehmen.

OK, jetzt wo man es mir erklärt hat, nehme ich es ihm übel.

Man kann mich damit aber nicht erreichen.

Symbiose · 29.11.2023

mafr22 schrieb:
Clip doch einfach in DT.
Command-C Safari Adresse
Command-N in DT.
Einloggen. Shoppen.
Mit Rechtsklick Seite erfassen den Kram sichern.
Du kannst auch aus der gesicherten PDF weitersurfen und andere Seiten sichern.
DT hat einen dynamischen Browser. Das Ausgangsformat ist dabei egal.

Na prima, das klappt.

Mit

Mit Rechtsklick Seite erfassen

geht es einwandfrei.

Würde ich in dieser DT Browser Seite über "Teilen" gehen, dann nicht.

Aber das ist wenigstens eine Möglichkeit.

Symbiose · 29.11.2023

bin_ichs? schrieb:
Was das Archivieren von Webinhalten angeht: Du hast hier unterschiedliche Möglichkeiten und du musst dich entscheiden, welche zu der jeweiligen Seite passt. Nicht jedes Format passt zu jeder Seite und vielleicht ist genau das das Verwirrende.

Vielleicht hilft dir mein Vorgehen: Das Meiste speichere ich als Markdown (aufgeräumt). Das Format ist schlank und kann mit einfachsten editiert bzw. weiterverwendet werden. Das Markdown-Dokument liegt dann in DT und ich kann es nachbearbeiten, d.h. ich lösche allen Kram raus, den ich nicht brauche. Das ist meist Werbung, bestimmte Zusatzinformationen oder auch Bilder, die nur der Dekoration dienen.

Das habe ich gerade versucht umzusetzen.

Seltsam daran ist allerdings, dass ich immer nur einen kleinen Teil der Seite und zwar genau dieser Seite hier, in der Vorschau und nach dem speichern erhalte. Und zwar immer den selben, niemals die gesamte Seite.

rudluc schrieb:
Ich selbst speichere die Seiten meistens als HTML-Seite. Man kann dann sogar anschließend die Seite in Grenzen editieren und Bereiche rauslöschen.

Ich denke, das dies die noch praktikabelste Lösung für mich persönlich darstellt, um eine Webseite, so wie ich sie sehe, dauerhaft zu archivieren und sogar zu bearbeiten. D.h., überflüssiges daraus entfernen.

Oder halt einfach, wie ich es bislang gemacht habe, per Safari einfach als PDF exportieren, denn das klappt praktisch narrensicher.

Symbiose · 04.12.2023

Guten Tag,

das leidige Thema, denn ich weiß mir keinen Rat.

Ich nutzt nun die DT 3 Pro Version. Habe darin lediglich 2 PDF Ordner indiziert.

Wenn ich nun in der Systemeinstellung des Mac schaue und mir anzeigen lassen, wie hoch der Datrenverbrauch bei den Dokumenten ist, wird mir dort angezeigt: Siehe Screenshot

Warum ist der Datenverbrauch dort so hoch, obwohl sie doch nur indiziert sind?

Gehe ich in DT in die jeweilige Datenbank und lasse mit die Informationen dazu anzeigen, lese ich:

Eigene Datenbank DT indiziert: 18.665 Objekte - 15,4 GB
Eigene Datenbank DT: 69 Objekte - 57,9 MB - und in der Systemeinstellung wird mit 980 MB angezeigt.

Ich verstehe das nicht, das DT derart viel Speicher verbraucht.
Obwohl doch nur bei der einen DT indiziert wurde.

bin_ichs? · 04.12.2023

Wieviel Speicher wird dir denn angezeigt, wenn du im Finder mit Command - I auf die Datenbank klickst?

Symbiose · 04.12.2023

bin_ichs? schrieb:
Wieviel Speicher wird dir denn angezeigt, wenn du im Finder mit Command - I auf die Datenbank klickst?

Im Finder wird mir angezeigt:

Bei der indizierten Datenbank: 1,38 GB
Bei der nicht indizierten Datenbank: 929 MB

Wobei die tatsächliche Größe der Ordner, die ich indiziert habe, 14,52 GB beträgt.

Ist es normal, dass dann die Größe der DT Datenbank bei einer Indizierung tatsächlich1,38 GB beträgt?

Wie gesagt, ich möchte es verstehen und nachvollziehen können.
Vor allem möchte ich wissen, ob das so stimmig ist.

Vielen Dank.

Sammelthread DEVONthink

Symbiose

Aktives Mitglied

rudluc

Aktives Mitglied

Symbiose

Aktives Mitglied

BSDheld

Aktives Mitglied

Gartentaucher

Aktives Mitglied

mafr22

Mitglied

Symbiose

Aktives Mitglied

Symbiose

Aktives Mitglied

bin_ichs?

Aktives Mitglied

bin_ichs?

Aktives Mitglied

mafr22

Mitglied

Symbiose

Aktives Mitglied

bin_ichs?

Aktives Mitglied

BSDheld

Aktives Mitglied

Symbiose

Aktives Mitglied

Symbiose

Aktives Mitglied

Symbiose

Aktives Mitglied

Symbiose

Aktives Mitglied

Anhänge

bin_ichs?

Aktives Mitglied

Symbiose

Aktives Mitglied