Sammelthread DEVONthink

Das dürfte eigentlich nicht sein. Mach mal mit Kontextklick das Datenbankpaket auf und schaue, was im Ordner Files zu finden ist und wie groß der ist.
 
Das dürfte eigentlich nicht sein. Mach mal mit Kontextklick das Datenbankpaket auf und schaue, was im Ordner Files zu finden ist und wie groß der ist.
Ist stelle einfach einmal ein Screenshot hier rein.
Sage mir bitte, ob das so normal ist, was man da sieht.
 
aus meiner Sicht kann das sein das schon sein wenn man nur einen Ordner indiziert, aber den Inhalt nicht importiert in die Datenbank. Du hast wahrscheinlich nur indizieren und nicht importieren ausgewählt.

https://www.devontechnologies.com/de/blog/20230818-understanding-indexing-files


Kannst Du auch aus den Antworten zu Deiner Frage ableiten:

Beitrag im Thema 'Sammelthread DEVONthink'
https://www.macuser.de/threads/sammelthread-devonthink.588121/post-12003253

Du möchtest (zumindest damals) zumindest nur indizieren und nicht importieren .. daher sollte doch klar sein warum der Index kleiner ist als das Verzeichnis.

und täglich grüßt das Murmeltier :)
 
Zuletzt bearbeitet:
Das sagte ich doch. Ich habe lediglich indiziert, nicht importiert.

@bin_ichs? ist der Meinung, das diese Größe nicht sein kann. :unsure:
Auf den Bildern die Du bisher gepostet hast war nichts von den 15GB zu sehen. Kannst Du mal einen Screenshot von dem Ordner Posten wo Dir 15GB angezeigt wird.

Kann es nicht sein das Du aus Versehen importieren statt indizieren ausgewählt hast? das würde es erklären
 
Die 15 GB beziehen sich auf dem Ursprungsordner, in dem die PDFs liegen.
Glaubst Du mir etwa nicht?

Nach dem Indizieren sind es dann 1,38 GB in DT.

Und jetzt sehe ich gerade, ohne weiteres Zutun, sind es nunmehr 2,1 GB des infizierten Ordners.

Siehe Unterschied zu Screenshot in Beitrag #1978

Siehe Screenshot.
Ich verstehe es immer weniger.
 

Anhänge

  • Bildschirmfoto 2023-12-04 um 16.59.05.png
    Bildschirmfoto 2023-12-04 um 16.59.05.png
    41,9 KB · Aufrufe: 39
Ist stelle einfach einmal ein Screenshot hier rein.
Sage mir bitte, ob das so normal ist, was man da sieht.

Ich verstehe nicht, warum diese Bsckups so aufgebläht sind. Das sind eigentlich nur Textdateien. Der Ordner Files scheint tatsächlich leer zu sein, also wurden die Dateien indiziert und nicht importiert.

Aber hatten wir dieses Problem nicht schon einmal…?
 
Darum schrieb ich ja: Das leidige Thema.
Es wurde nie wirklich geklärt.

Und da ich mich damit überhaupt nicht auskenne und gesagt wurde, das ist so nicht richtig, die Frage hier.
Leider erneut.

In dem indizierten Ordner liegen nur PDF Dateien und Bilder.
Wenn z.B. Bilder auf einer Webseite vorhanden sind, habe ich die Seite als PDF gesichert und die Bilder dann in den Ordner dieser PDF Datei gesichert.
Hängt das evtl. damit zusammen?

@troubadix2004
Ich habe tatsächlich lediglich indiziert.
 
Neuaufbau der Datenbank etc. hast du vermutlich schon gemacht. Könntest du mal (an einem Duplikat der Datenbank) diese Anweisungen folgen:

Letzte Rettung für Datenbanken
 
Das habe ich nun gemacht, brachte aber keinerlei Änderung.

Mir ist jetzt folgendes aufgefallen:

Die Datenbank die ich angelegt habe, die also nicht indiziert ist:
Wenn ich mir den Paketinhalt anzeigen lasse und dort die Datei Files.noindex öffne, sind darin die folgenden Ordner vorhanden:

--> html
--> md
--> pdf
.....

Wenn ich mir den Paketinhalt der indizierten Datenbank anschaue und dort die Datei Files.noindex öffne ist diese leer!
Darunter, also unterhalb des Ordner sind dann die Dateien:

Devonthink-1.dtMeta
Devonthink-2.dtMeta
.....
aufgeführt.
Und diese Dateien haben recht viele MB

Man findet diese Dateien:
Devonthink-1.dtMeta
Devonthink-2.dtMeta
......

...auch in der nicht indizierten Datenbank, doch haben sie dort nur wenige KB oder höchsten 1-2 MB.

Kannst Du daraus etwas ableiten?


EDIT:
Ich sehe gerade, das mit dem Ordner Files.noindex und der Indizierung hattest Du weiter oben noch nachgereicht.

  • Ich weiß ja nicht, ob es damit zusammenhängen kann, das in dem indizierten Ordner auch Bilddateien zu den PDFs liegen.
 
Zuletzt bearbeitet:
Der Anbieter beschreibt hier ganz grob, warum Datenbanken sehr groß werden können: https://www.devontechnologies.com/de/blog/20220315-understanding-database-sizes

Auszug:
„Es gibt immer noch den durchsuchbaren Text und die Metadaten für die in der Datenbank gespeicherten Dokumente, die die KI von DEVONthink benötigt. Bei textlastigen Inhalten, auch wenn Sie sie indizieren statt importieren, kann dies immer noch eine beträchtliche Datenbankgröße ergeben. “
 
Das erklärt aber nicht dies: Da ist einmal eine Datenbank mit indizierten Inhalten und dann eine mit importierte Inhalten. Wenn ich das recht verstanden habe, sind es die gleichen Inhalte, nur einmal importiert und das andere Mal importiert. Und beide Datenbanken haben derart unterschiedliche Größen.

Und das kann ich nicht nachvollziehen.
 
Das erklärt aber nicht dies: Da ist einmal eine Datenbank mit indizierten Inhalten und dann eine mit importierte Inhalten. Wenn ich das recht verstanden habe, sind es die gleichen Inhalte, nur einmal importiert und das andere Mal importiert.
Das hast Du falsch verstanden.

Ich habe eine Datenbank angelegt, in der ich 2 Ordner, in denen PDFs liegen, indiziert habe. Das ist die Datenbank die so groß ist.

Und beide Datenbanken haben derart unterschiedliche Größen.
Dann habe ich eine weitere Datenbank angelegt, in der ich einige we ice Dinge abgelegt habe. Aus Internetseiten etc.
Das ist die Datenbank mit der geringeren Größe.
 
Das erklärt aber nicht dies: Da ist einmal eine Datenbank mit indizierten Inhalten und dann eine mit importierte Inhalten. Wenn ich das recht verstanden habe, sind es die gleichen Inhalte, nur einmal importiert und das andere Mal importiert. Und beide Datenbanken haben derart unterschiedliche Größen.

Und das kann ich nicht nachvollziehen.
Ok, das habe ich tatsächlich anders verstanden.
Wobei die Werte zwischen den Beiträgen von Symbiose differieren, ggf. werden die Unterschiede durch die Backups größer (wenn die eine DB im Zugriff war, die andere aber nicht mehr zum Beispiel).
 
Du machst dir zu viele Gedanken. 🥱
 
  • Gefällt mir
Reaktionen: roger.rebel, M001 und bin_ichs?
Ok, das habe ich tatsächlich anders verstanden.
Wie gesagt, ich habe die eine Datenbank indiziert - das sind die 15,4 GB PDF Files, die indiziert wurden.


Dann habe ich eine weitere Datenbank erstellt, in der ich eigene Dinge abgelegt habe. Webseiten, andere PDFs etc.
Wobei die Werte zwischen den Beiträgen von Symbiose differieren, ggf. werden die Unterschiede durch die Backups größer (wenn die eine DB im Zugriff war, die andere aber nicht mehr zum Beispiel).
Diese indizierte Datenbank ist groß. Dabei spielen sicher auch die beiden darin enthaltenen Backup Ordner eine Rolle.
Diese beiden Backup Ordner habe ich nun aus diesem Datenbank Paket gelöscht.

Nun hat diese indizierte Datenbank lediglich noch 672 MB.

Die Frage ist nun:

Kann ich jetzt davon ausgehen, das indizierte PDFs, die am Ursprungsort um die 15,4 GB besitzen, als DT Datenbank dann ca. 672 MB aufweisen?
 
Du löschst Backup-Ordner aus dem Paket? Die werden eh wieder angelegt, im schlechten Fall bringst Du damit aber Routinen durcheinander.

Zur Frage: Nein, aus meiner Sicht nicht pauschal (wenn Du das Größenverhältnis meinst).
 
Ich glaube, ich deinstalliere das alles zunächst wieder....

Möglicherweise wäre auch ein Import zielsicherer.
 
Zuletzt bearbeitet:
An die Experten:


Und auch dazu benötige ich freundlicherweise eine Erklärung, denn für mich ist das nicht nur wenig plausibel, es ist einfach unverständlich:

Ich habe eine Datenbank angelegt, in der ich einige wenige PDFs abgelegt habe, einige Webseiten, 2 Bedienungsanleitungen.
Insgesamt hat diese Datenbank 57 MB.

Schaue ich mir nun den Paketinhalt dieser Datenbank an, befinden sich darin 2 Backup Ordner.
Der eine Backup Ordner hat 658 MB
Der zweite Backup Ordner hat 208 MB

Das ist für mich absolut unverständlich, da die Datenbank ja nur 57 MB besitzt.

Was veranstaltet Devonthink da nur?
Das verstehe ich absolut nicht.

Und ich würde es wirklich sehr gerne verstehen. Denn nur dann, kann ich DT ruhigen Gewissens weiter einsetzen und benutzen.

Danke für Eurer Verständnis
 
Zuletzt bearbeitet:
Zurück
Oben Unten