Neujahrsputz - Rechner aufräumen - wie gehe ich vor?

Schmidt13

Neues Mitglied
Thread Starter
Registriert
21.12.2020
Beiträge
24
Hallo,
nach erfolgreicher Neuinstallation und Datenwiederherstellung (anfängliche Probleme, weil offensichtlich meine Art Daten zu sichern nicht korrekt war), geht es nun ans Aufräumen. Hier würde ich gerne erfahren wie ich am sichersten vorgehen kann...
Vorbereitung: Time Machine Backup (inkl. externer Festplatte) ist bereits gestartet. :)
Ziel: Dateien zusammenführen, Duplikate finden, Bestand reduzieren, mit wenig Verschachtelung übersichtlicher ordnen und dabei umbenennen.
Frage: Was spricht gegen diese Reihenfolge?
  1. Zusammenführen der Dateien (iCloud Drive oder eine externe Festplatte verwenden?)
  2. Duplikate finden und reduzieren
  3. Vorhandene verschachtelte Ordnerstruktur auflösen
  4. Neuordnung in Ordnerstruktur mit maximal 2 Ebenen:
    • Schreibtisch/Privat/Themen xyz
    • Schreibtisch/Recherche/Themen xyz
    • Schreibtisch/Beruf/Themenxyz
  5. Umbenennen der bereits geordneten Dateien
Anregungen für besseres Vorgehen erwünscht, vielleicht habe ich nicht alles bedacht?

Schönen Sonntag!
 

walfreiheit

Aktives Mitglied
Registriert
06.06.2004
Beiträge
35.224
Ist halt eine sehr individuelle Sache. Wie im echten Leben: Die Art, deine Daten zu sortieren muss dir liegen, und du musst deine Dateien wiederfinden können.
 

Stargate

Aktives Mitglied
Registriert
27.02.2002
Beiträge
9.982
Hallo,
nach erfolgreicher Neuinstallation und Datenwiederherstellung (anfängliche Probleme, weil offensichtlich meine Art Daten zu sichern nicht korrekt war), geht es nun ans Aufräumen.

Wenn du tatsächlich neu installiert hast gibt es nichts zum aufräumen auf einem Mac, in dem Sinn.
Alles andere ist absolut individuell und nach eigenem ermessen, wie z.b das zusammenführen von irgend was.

Duplikate finden ist eine eigene Geschichte.
 

thulium

Aktives Mitglied
Registriert
12.11.2011
Beiträge
2.262
Zusammenführen der Dateien (iCloud Drive oder eine externe Festplatte verwenden?)

Du hast ja in einem anderen Thread von Widrigkeiten rund um das Verhalten von iCloud-Drive berichtet. Ich kenne mich mit diesem Dienst nicht aus und meide ihn, weil ich es nicht mag, wenn ich das exakte Verhalten und die exakten lokalen Positionen der Ordner nicht durchschaue. Aber vielleicht antwortet ja noch jemand in dem anderen Thread und kann die Ursache für Deine Widrigkeiten aufklären.

Kurz: ich würde für die Normalisierung aller Dateien die externe Festplatte verwenden. Danach iCloudDrive restlos löschen und neu befüllen mit dem normalisierten Bestand.


Duplikate finden und reduzieren
Das Programm Duplicate Finder gilt als gut. Aber ich kenne es nicht aus eigener Erfahrung.
Vorhandene verschachtelte Ordnerstruktur auflösen
Das geht in einem Rutsch mit dem Dateimanager Forklift.
Wenn Du im Suchfeld ".*" eingibst und "nach Name" wählst, dann werden Dir alle Dateien aller Unterordner angezeigt und Du kannst sie in die Hauptebene eines beliebigen Ordners kopieren.

Problematisch wäre das, wenn es noch gleichnamige Dateien gibt. Forklift kopiert, ohne weitere Hinweise, nur eine einzige der gleichnamigen Dateien.
Du müsstest also, um diesen Prozess der Extraktion aller Dateien aus allen Unterordnern gefahrlos nutzen zu können, zunächst gleichnamige Dateien eliminieren, wie auch immer.
Neuordnung in Ordnerstruktur mit maximal 2 Ebenen
Hier haben ja schon andere geschrieben, dass dies eine sehr individuelle Entscheidung ist.
Selber wünsche ich mir, dass Apple endlich potente Verschlagwortung tief im Finder integriert, so dass man völlig auf jeglichen Ordner und jeglichen individuell vergebenen Dateinamen verzichten kann. Vielleicht kommt sowas auch nie. Das Paradigma Datei/Ordner ist fest verankert.
Ich möchte also so mit Dateien arbeiten, wie professionelle Fotografen es schon lange tun. Mit einer Datenbank und mit Verschlagwortung.
Umbenennen der bereits geordneten Dateien
Mächtige Tools sind zum Beispiel ABetterFinderRename. Aber auch Forklift kann ziemlich viel.

Wenn Du sehr knifflige Suchmuster hast, die sich über die Standard-Optionen der Umbennungswerkzeuge nicht lösen lassen, sind sog. reguläre Ausdrücke die Lösung.
Falls Du damit unerfahren bist, kannst Du ja hier dazu um ganz konkrete Hilfe bitten.

Mit solchen Ausdrücken kann man sehr effizient, gezielt und präzise Ersetzungen vornehmen.

Online-Tool zum Rumspielen: https://www.debuggex.com/

Viel Erfolg!
 
Zuletzt bearbeitet:

MacKaz

Aktives Mitglied
Registriert
12.01.2020
Beiträge
1.632
Die Frage ist auch, um welchen Umfang es geht (Größe, Anzahl der Dateien, Art der Dateien).
Eventuell kann sich dann schon lohnen, ab Neusortierung ein Programm wie Eagle Filer (günstig) oder Devonthink einzusetzen.

Duplikate zu finden, kann sehr stark von der Art der Dateien abhängen und davon, was als „Duplikat“ gilt (Zwischengespeicherte Dokumente, ähnliche Bilder?).
Ich bin irgendwann dazu übergegangen, mich primär anhand der Prüfsumme zu orientieren, das hat bei mir einen ganz schönen Schwung an Dateien zu Tage gefördert, die durch verschiedene Umstände unterschiedliche Namen hatten, aber identisch waren. Das ist übrigens auch eine Gefahr, wenn man zu schnell mit Tools wie A Better File Rename bei der Hand ist.
 

thulium

Aktives Mitglied
Registriert
12.11.2011
Beiträge
2.262
Eventuell kann sich dann schon lohnen, ab Neusortierung ein Programm wie Eagle Filer (günstig) oder Devonthink einzusetzen.
Kennst Du (oder ein anderer Mitleser) eines oder beide aus eigener Erfahrung und hättest Lust mal zu erzählen, unter welchen Randbedingungen so ein zusätzliches Dateiverwaltungswerkzeug aus Deiner Sicht wirklich nützlich ist?
 

Schiffversenker

Aktives Mitglied
Registriert
25.06.2012
Beiträge
12.747
Ja, aber bei über 1400 Einträgen dort könnten einen paar Erfahrungen hier in diesem Thread nicht ganz unsinnig sein.
Dort geht es sicher sehr ans Eingemachte.

Hilfreich wäre aber sicher, wenn der TE bzw. thulium von sich aus mehr über ihre Bedürfnsse schreiben würden.
Welche Mengen an Dateien, welche Art/welches Format, nur verwalten, verschlagworten und durchsuchen oder auch dynamisch bearbeiten?
Sollen/müssen Dateien auch außerhalb von DT oder ähnlichen Datenbanken/datenbankähnlichen Programmen bearbeitet werden?
 

MacKaz

Aktives Mitglied
Registriert
12.01.2020
Beiträge
1.632
Kennst Du (oder ein anderer Mitleser) eines oder beide aus eigener Erfahrung und hättest Lust mal zu erzählen, unter welchen Randbedingungen so ein zusätzliches Dateiverwaltungswerkzeug aus Deiner Sicht wirklich nützlich ist?
Oh, da könnte ich weit ausholen, das wird heute Abend aber nichts mehr ;)
Vorab: Beide Programme sind sowas wie die berühmte Eier legende Wollmilchsau und jeder muss für sich schauen, ob und wie er sowas einsetzen kann und möchte. Ich habe mich ziemlich auf Devonthink („DT“) festgelegt, nutze Eagle Filer nur für ein paar „Spezialfälle“ bzw. bin dabei, es einzuführen. Viele Funktionen gibt es auch im System oder durch andere Programme (Bsp: Houdahspot und Spotlight als Suchen, Hazel für Regelbasierte Dateioperationen), aber vor allem Devonthink bietet viel gemeinsam unter einer Haube und das nicht nur unter macOS, sondern auch unter iOS.
Ein paar Hinweise habe ich vor kurzem hier gegeben: https://www.macuser.de/threads/beratung-dokumentenscanner-erbeten.866261/#post-10907025
Vielleicht ist das ja schon ein bisschen vom erhofften Input drin, auch wenn es sich nicht so sehr auf Devonthink als Dateiverwaltung bezieht.
Das versuche ich hier noch mal zu ergänzen.
 

thulium

Aktives Mitglied
Registriert
12.11.2011
Beiträge
2.262
@Schmidt13
Wenn es Dich stört, hier in diesem Thread auch die Dokumentenverwaltungen Devonthink und EagleFiler zu besprechen, lasse es mich bitte wissen. Es liegt mir fern, Deinen Thread "kapern" zu wollen.

@MacKaz
Wie schön, dass Du Lust hast, ein wenig Auskunft zu geben.

Ich kann ja meinen eigenen Usecase mal skizzieren.

Mit dem Auszuschließenden fange ich an.
Was benötige ich nicht in der Dokumentenverwaltung?
  1. Notizen (Ich bin sehr zufrieden mit der Standard-Notiz-App)
  2. Bilder (Ich nutze ausschließlich die Standard-Foto-App)
  3. Musik (Ich nutze ausschließlich die Standard-Musik-App)
  4. Mails (Mir genügt Thunderbird mit seiner Volltextsuche und den logischen Operatoren, mittelfristig werde ich auf Mailmate wechseln)
  5. Scans von Dokumenten (Ich habe praktisch keine, die zwei Hände voll pro Jahr sind mir nicht wichtig)
Was für Dokumenttypen möchte ich also verwalten?
  1. HTML (Komplexere und umfangreiche Inhalte schreibe ich nicht in den Notizen, sondern als HTML-Dokument, weil es mein liebstes Format ist und ich es im Quelltext beherrsche. Ich verwende es statt einer Textverarbeitung.)
  2. PDF (Ich mag das Format gar nicht, muss mich aber damit arrangieren, da es ein typisches Verteilungsformat ist)
  3. XLS/ODS (Tabellenkalkulation)
  4. SKT (Zeichnungen im 3D-Vektorgrafik-Programm Sketchup)
  5. EPUB (Bücher)
  6. MHTML (Webseite archivieren in Form einer einzigen Containerdatei, die alle eingebetteten Inhalt enthält)

Welche Funktionen bietet meine bisher verwendete Dateiverwaltung Forklift bereits?
  1. Volltextsuche
  2. Vorschau
  3. Synchronisieren von Ordnern
  4. Batch-Umbenennung

Was also würde mich reizen?
  1. Keinerlei Ordner
  2. Keinerlei selbst vergebene Dateinamen (Die automatisch vergebenen Dateinamen bestünden aus IDs, aber mit denen würde man gar nicht konfrontiert im UI)
  3. Ausschließlich Tagging
  4. Gutes UI für das schnelle Zuweisen von Tags per Tastenkürzel
  5. Beim Exportieren von Dokumenten kann gewählt werden, ob die Tags in den Dateinamen automatisch eingefügt werden
  6. Beim Importieren von Dokumenten werden aufgrund einer Volltextanalyse Tags vorgeschlagen, basierend auf dem gesamten bestehenden Datenbestand und dessen Tags (Tagging ist nur dann praxistauglich, wenn man damit nicht viel Zeit verbringen muss)
  7. Versionsverwaltung (also ohne Zuhilfename von Time Machine zu anderen Zuständen der Datei navigieren)
  8. Monitoring zu Duplikaten um diese gleich beim Importversuch zu verhindern
  9. Metadaten werden erfasst und zugänglich gemacht. Zum Beispiel die Herkunft einer Datei (Download von einer Website, Erstellt von mir, Anhang einer Mail von Person, ...) oder der verwendete Editor, etc.
 
Zuletzt bearbeitet:

thulium

Aktives Mitglied
Registriert
12.11.2011
Beiträge
2.262
@MacKatz
Falls Du noch Gelegenheit findest, ein wenig zu dem konkreten Usecase zu schreiben: ich bin sehr neugierig auf Deine Motive für die Verwendung von DevonThink.

Und falls ein Nutzer von EagleFiler mitliest ... : )
 

Schmidt13

Neues Mitglied
Thread Starter
Registriert
21.12.2020
Beiträge
24
Duplikate zu finden, kann sehr stark von der Art der Dateien abhängen und davon, was als „Duplikat“ gilt (Zwischengespeicherte Dokumente, ähnliche Bilder?).
Ich bin irgendwann dazu übergegangen, mich primär anhand der Prüfsumme zu orientieren, das hat bei mir einen ganz schönen Schwung an Dateien zu Tage gefördert, die durch verschiedene Umstände unterschiedliche Namen hatten, aber identisch waren. Das ist übrigens auch eine Gefahr, wenn man zu schnell mit Tools wie A Better File Rename bei der Hand ist.
@MacKatz
Auch das ist natürlich wichtig, herauszufinden wie oft sich der gleiche oder vergleichbare Inhalt hinter verschiedenen Namen verbirgt. Ich bin mir der Problematik bewusst. Ich habe das Ausmaß der Doppelung bis hin zur Verzehnfachung dadurch herausgefunden, dass ich mal die Dateien nach Größe ordnen ließ und mir gleich große Pakete mal konkret angeschaut habe... dabei ist mir klar geworden, dass der Vorgang maßgeblich durch verschachtelte Ordnersysteme entstanden ist und durch das Kopieren zwischen Volumes, was ja gerne zur Verdoppelung führt. Alles kein Problem, wenn man in Windows-Logik akzeptiert, dass alle Festplatten immer größeres Volumen bereitstellen... pack es auf die Externe und denk nicht drüber nach... Aber es ist ohnehin schon anstrengend, sich um gemalte Bilder von vor 10 Jahren zu kümmern, noch anstrengender ist dann das verbindliche digitalisierte Äquivalent Werkverzeichnis zu führen. Ich bin kein Digital-Nerd, ich wollte, dass mir das digitale eine hilfreiche Unterstützung ist. Mittlerweile kam der Umstieg auf den Mac und dann kamen noch andere Betätigungsfelder hinzu - Erstellen von Lehrmaterial - weswegen die konkrete Last der Dateien immens gestiegen ist.

Kannst Du mir erklären, wie Du Dich an Prüfsummen orientiert hast? Was ist eine Prüfsumme? Welches Programm benötige ich dafür?
Ich bin noch nicht soweit, um über DevonThink nachzudenken, habe aber den Link angeschaut und werde zu einem späteren Zeitpunkt, wenn ich meine unten genannten Probleme geklärt habe nochmal auf Deinen Tipp zurückkommen. Du sagtest ja, es käme erst nach der Neuordnung in Betracht, richtig?

Hier nochmal aktualisiert der Grund meiner Anfrage:
Es geht um ein Logistik-Problem:

Ziel: Dateien zusammenführen, Duplikate finden (spezifiziert), Bestand reduzieren, mit wenig Verschachtelung übersichtlicher ordnen und dabei umbenennen.
Frage: Was spricht gegen diese Reihenfolge?
  • Zusammenführen der Dateien auf ein Volume, um Bestand zu überblicken (.key,.pages,.docx,.pdf,.odt,.odp,.jpg,.tiff, ... aus iCloud Drive, mehreren Festplatten, USB-Sticks, Rechner - iCloud Drive oder eine externe Festplatte verwenden?)
  • Duplikate finden und reduzieren (hier könnte die Maßgabe sein, die früheste Datei, die Größte Datei und die letzte Datei zu behalten, dann hätte man zumindest eine Reduktion von 10 auf 3, aber in welcher Reihenfolge geht man vor?)
    • gleicher Inhalt differente Größe/Bearbeitungsstand (Masterdatei, Bearbeitung)
    • gleicher Name differenter Inhalt/Größe/Bearbeitungstand (Fortsetzung, Korrekturfassung, niedrige Auflösung)
  • Vorhandene verschachtelte Ordnerstruktur auflösen
  • Neuordnung in Ordnerstruktur mit maximal 2 Ebenen:
    • Schreibtisch/Privat/Themen xyz
    • Schreibtisch/Recherche/Themen xyz
    • Schreibtisch/Beruf/Themenxyz
  • Umbenennen der bereits geordneten Dateien
Anregungen für besseres Vorgehen (in Schritten) erwünscht, vielleicht habe ich nicht alles bedacht?

Danke für die vielen Tipps!
 
Zuletzt bearbeitet:

Schmidt13

Neues Mitglied
Thread Starter
Registriert
21.12.2020
Beiträge
24
ich würde für die Normalisierung aller Dateien die externe Festplatte verwenden. Danach iCloudDrive restlos löschen und neu befüllen mit dem normalisierten Bestand.
ich tendiere zu einem Auffüllen der iCloud mit .key und .pages Dateien, dann vergleichen und reduzieren, das würde meine Dateien seit 2018 reduzieren. Über das Einpflegen der .jpg Bilder in die Mediathek denke ich nach... Was passiert mit .tif und .jpg als Dateien, wenn man sie in die Mediathek einpflegt? Was passiert dann mit den Dateinamen?
 

MacKaz

Aktives Mitglied
Registriert
12.01.2020
Beiträge
1.632
Hallo thulium,
sorry, der Lockdown hat bei mir in den letzten Tagen für etwas mehr Aufwand als erwartet gesorgt (Servicevorgänge komplizierter etc.). Außerdem hatte ich zwar angefangen, musste mich aber ein bisschen mit dem Editor hier rumärgern - ich hoffe, es sind jetzt nicht zu viele „Mängel“ drin ;)
Ich versuche mal direkte Antworten auf die Fragen zu geben.
Wie schön, dass Du Lust hast, ein wenig Auskunft zu geben.
Klar, mache ich gern :)
Wobei ich tatsächlich glaube, dass zumindest DT bei Dir einiges „brechen“ würde.
Zur Vereinfachung: Devonthink bezeichne ich nachvollgend als DT, Devonthink to go als DTGO.

Mit dem Auszuschließenden fange ich an.
Was benötige ich nicht in der Dokumentenverwaltung?
  1. Notizen (Ich bin sehr zufrieden mit der Standard-Notiz-App)
  2. Bilder (Ich nutze ausschließlich die Standard-Foto-App)
  3. Musik (Ich nutze ausschließlich die Standard-Musik-App)
  4. Mails (Mir genügt Thunderbird mit seiner Volltextsuche und den logischen Operatoren, mittelfristig werde ich auf Mailmate wechseln)
  5. Scans von Dokumenten (Ich habe praktisch keine, die zwei Hände voll pro Jahr sind mir nicht wichtig)


Was für Dokumenttypen möchte ich also verwalten?
  1. HTML (Komplexere und umfangreiche Inhalte schreibe ich nicht in den Notizen, sondern als HTML-Dokument, weil es mein liebstes Format ist und ich es im Quelltext beherrsche. Ich verwende es statt einer Textverarbeitung.)
  2. PDF (Ich mag das Format gar nicht, muss mich aber damit arrangieren, da es ein typisches Verteilungsformat ist)
  3. XLS/ODS (Tabellenkalkulation)
  4. SKT (Zeichnungen im 3D-Vektorgrafik-Programm Sketchup)
  5. EPUB (Bücher)
  6. MHTML (Webseite archivieren in Form einer einzigen Containerdatei, die alle eingebetteten Inhalt enthält)
Grundsätzlich kannst Du alle Dateitypen, die im System hinterlegt sind, anschauen (wie bei Quicklook).
MHTML wurde bei mir nicht gut dargestellt, das muss ich mir noch mal anschauen.
HTML als „Ganze Seite“, also wo noch ein Ordner erstellt wird, ist unter macos kein Problem, aber unter DTGO (vermutlich wegen der Pfade).
ODS kann ich aus DT aufrufen, wird aber (auf meinem System) nicht mit einer Voransicht versehen. Vermutlich, weil ich nur Excel habe. Das schaue ich mir noch mal an, ob das mit Libre Office oder so anders wird.
SKT liegt mir nicht vor.
PDF und Epub waren bisher bei mir kein Problem (von einzelnen Quelldateien mit Mängeln mal abgesehen).
Einige Dateitypen (wie Markdown lassen sich direkt editieren), das nutze ich häufig für schnelle Erfassungen.


Welche Funktionen bietet meine bisher verwendete Dateiverwaltung Forklift bereits?
  1. Volltextsuche
  2. Vorschau
  3. Synchronisieren von Ordnern
  4. Batch-Umbenennung
Das wird auch von DT geboten, wobei die Synchronisation ja zumindest im Dateisystem eigentlich nicht mehr anfällt.
Es gibt aber einen Download-Manager, mit dem man z.B. automatische Downloads samt Aktualisierungen durchführen kann. Ich werde wohl mal ausprobieren, wie das eigentlich mit Sharepoint zusammenspielt/zusammenspielen kann.
DT bietet darüber hinaus eine ziemlich feine Suche mit zig Parametern (es wurde ursprünglich mal als Recherchetool entwickelt). Das kenne ich so eigentlich nur von Suchmaschinen, habe mir das aber in Forklift noch nicht allzu genau angeschaut.
Was also würde mich reizen?
Sowohl DT als auch EagleFiler legen schon Ordner an, die Du im Dateisystem sehen. und (theoretisch) nutzen kannst. Das ist sogar ein Vorteil, weil Du nicht in eine komplette Abhängigkeit kommst.
Innerhalb des Programms kommen Ordner ebenfalls zum Tragen, aber man muss sie nicht nutzen.
[*]Keinerlei selbst vergebene Dateinamen (Die automatisch vergebenen Dateinamen bestünden aus IDs, aber mit denen würde man gar nicht konfrontiert im UI)
Also die Dateien haben schon einen Namen, unter dem sie in der Datenbank und auch im Dateisystem gespeichert werden. Die ID innerhalb DT wird zusätzlich angelegt.
[*]Ausschließlich Tagging
Das funktioniert so nicht, aber Du kannst die Dokumentnamen beeinflussen und auch per Stapelverarbeitung anpassen (zum Beispiel umbenennen anhand der enthaltenen Tags,Erstellungsdatum, etc.).
[*]Gutes UI für das schnelle Zuweisen von Tags per Tastenkürzel
Das gibt es m.W. nicht, adhoc konnte ich da (innerhalb DT) DT keinen Weg finden. Aber die Tags werden ja eigentlich auch automatisch gesetzt.
[*]Beim Exportieren von Dokumenten kann gewählt werden, ob die Tags in den Dateinamen automatisch eingefügt werden
Geht nicht als Standard so wie „speichern unter“, man müsste da wahrscheinlich auf die Stapelverarbeitung zurückgreifen. Müsste ich ausprobieren, bisher war DT eher eine Einbahnstraße „rein“.
[*]Beim Importieren von Dokumenten werden aufgrund einer Volltextanalyse Tags vorgeschlagen, basierend auf dem gesamten bestehenden Datenbestand und dessen Tags (Tagging ist nur dann praxistauglich, wenn man damit nicht viel Zeit verbringen muss)
Die werden gleich eingefügt, Du hast irgendwann eine regelrechte „Tagstruktur“.Das hat zwar noch mal für ein bisschen Aufwand gesorgt (manche überzähligen zu entfernen), aber das war tw. sehr aufschlussreich und fast schon lustig. Dabei fielen mir nämlich viel Dinge auf, die jahrelang unbemerkt blieben (Autoren von Dokumenten, bei denen der Name abwich. längst unbekannte Autoren, etc.). Muss man aber nicht so machen, man kann auch einfach alle überzähligen löschen. Bei mir hat sich übrigens ein weiteres Tool bewährt, dass auf DT ausgelegt ist, aber auch im Dateisystem suchen kann. Das ist Ammonite, im Grunde genommen eine Tagwolke, die eine mehr oder wenige beliebige Zusammenstellung von Begriffen ermöglicht, inkl. Ausschlussmöglichkeit. Hat mir sehr geholfen, bestimmte Strukturen bei mir aufzudecken. Tolles und günstiges Tool.
[*]Versionsverwaltung (also ohne Zuhilfename von Time Machine zu anderen Zuständen der Datei navigieren)
Nein, das gibt es m.W. nicht. Du wünschst es Dir vermutlich so wie in Sharepoint.
Vielleicht lässt sich das irgendwie (ohne händische Eingriffe) abbilden, finde das sehr interessant und werde das mal irgendwann betrachten.
[*]Monitoring zu Duplikaten um diese gleich beim Importversuch zu verhindern
Jein, also Devonthink hat intelligente Ordner und die zeigen dann auch Duplikate an.
Leider gibt es keine Option, das über Prüfsummen zu machen und vor allem auch nicht beim Import. Das ist einer der gründe, weshalb ich mir gerade auch Eaglefiler anschaue, zumindest während der Bereinigung meines Datenbestandes.
[*]Metadaten werden erfasst und zugänglich gemacht. Zum Beispiel die Herkunft einer Datei (Download von einer Website, Erstellt von mir, Anhang einer Mail von Person, ...) oder der verwendete Editor, etc.
Das ist grundsätzlich „Standard“, kann im Einzelfall aber sicher auch vom Workflow abhängen. Da das Dokument ja nicht verändert wird, hast Du zum Beispiel bei Word natürlich weiterhin den/die AutorIn drin, wird aber in aller Regel beim Import auch als Tag gesetzt.

Für Dich vermutlich nicht das richtige Tool, wenn ich das so summa summarum sehe.
ABER: Evtl. ist die Demo mal einen Versuch wert. Ich habe bei früheren Versionen von DT tw. geflucht und manche Vorteile gar nicht so recht erkannt, das kam erst, als ich so richtig konkret gesagt habe „nun aber einmal richtig“. Mit einem Mal fielen mir die vielen Kleinigkeiten auf, bei denen ich mich nur leicht umgewöhnen musste und seitdem viel effizienter mit Dateien arbeiten kann.
 

thulium

Aktives Mitglied
Registriert
12.11.2011
Beiträge
2.262
Ziel: Dateien zusammenführen, Duplikate finden (spezifiziert), Bestand reduzieren, mit wenig Verschachtelung übersichtlicher ordnen und dabei umbenennen.
Frage: Was spricht gegen diese Reihenfolge?
Sieht für mich nach einer vernünftigen Reihenfolge aus.

Der Knackpunkt ist meiner bescheidenen Meinung nach: "Duplikate finden".

Ich habe das hier von mir erwähnte Programm "Duplicate File Finder" (https://nektony.com/duplicate-finder-free) nur einmal kurz ausprobiert und kann daher nichts Genaueres dazu sagen. Auch nicht, ob empfehlenswerte Programme für das Bewältigen der Aufgabe existieren.

Vielleicht schreiben ja andere hier im Thread noch was zu diesem Thema.
 

MacKaz

Aktives Mitglied
Registriert
12.01.2020
Beiträge
1.632
Hi,
@MacKatz
Auch das ist natürlich wichtig, herauszufinden wie oft sich der gleiche oder vergleichbare Inhalt hinter verschiedenen Namen verbirgt. Ich bin mir der Problematik bewusst. Ich habe das Ausmaß der Doppelung bis hin zur Verzehnfachung dadurch herausgefunden, dass ich mal die Dateien nach Größe ordnen ließ und mir gleich große Pakete mal konkret angeschaut habe... dabei ist mir klar geworden, dass der Vorgang maßgeblich durch verschachtelte Ordnersysteme entstanden ist und durch das Kopieren zwischen Volumes, was ja gerne zur Verdoppelung führt. Alles kein Problem, wenn man in Windows-Logik akzeptiert, dass alle Festplatten immer größeres Volumen bereitstellen... pack es auf die Externe und denk nicht drüber nach... Aber es ist ohnehin schon anstrengend, sich um gemalte Bilder von vor 10 Jahren zu kümmern, noch anstrengender ist dann das verbindliche digitalisierte Äquivalent Werkverzeichnis zu führen. Ich bin kein Digital-Nerd, ich wollte, dass mir das digitale eine hilfreiche Unterstützung ist. Mittlerweile kam der Umstieg auf den Mac und dann kamen noch andere Betätigungsfelder hinzu - Erstellen von Lehrmaterial - weswegen die konkrete Last der Dateien immens gestiegen ist.
Das beschreibt ziemlich gut meine Situation. Du glaubst übrigens gar nicht, wie man manche Programme, mit denen man zur Erstellung von Lehrmaterial, Publikationen etc. arbeitet, regelrecht verfluchen kann, weil sie (indirekt) für Duplikate sorgen.
Ein zusätzliches Problem ist die Übertragung auf andere Medien, die unter bestimmten Umständen ja auch für Erstellungsdaten im Moment des Kopierens sorgt. Finde ich für manche Dateien sehr ungünstig, nicht nur beim Aufräumen.

Kannst Du mir erklären, wie Du Dich an Prüfsummen orientiert hast? Was ist eine Prüfsumme? Welches Programm benötige ich dafür?
Ich bin noch nicht soweit, um über DevonThink nachzudenken, habe aber den Link angeschaut und werde zu einem späteren Zeitpunkt, wenn ich meine unten genannten Probleme geklärt habe nochmal auf Deinen Tipp zurückkommen. Du sagtest ja, es käme erst nach der Neuordnung in Betracht, richtig?
Eine Prüfsumme ist ein berechneter Wert, der vom Ausgangsmaterial abhängt.
Dabei führt grundsätzlich jede Änderung am Ausgangsmaterial auch zu einer Änderung der Prüfsumme (selbst ein Umbruch in einem Word-Dokument).
Es gibt Programme, die diese Prüfsummen berechnen und bei Bedarf auch zwischen mehreren Dateien vergleichen können.
Ich bin immer daran verzweifelt, vor lauter Dateien gar nicht mehr zu erkennen, was unterschiedliche Versionen sind und was eben nicht. Ich weiß nicht mehr, wie ich genau darauf kam, aber irgendwann habe ich die Duplikatsuche in Treesize (nur Windows) entdeckt und plötzlich machte es „Klick“, als ich die Spaltenauswahl sah ;)

Das habe ich im Lauf der Zeit dann mit weiteren Tools ergänzt:
- Beyond Compare (macOS, Windows, Linux): Vergleicht Ordner und Dateien, diverse Suchkriterien, u.a. auch die Prüfsumme. Ziemlich praktisch, wenn man zum Beispiel 90% Übereinstimmung hat und möglichst schnell die eindeutig doppelten entfernen will.
- Checksum (macos Appstore, wird anscheinend nicht mehr gepflegt): Kann Dateien mit Prüfsummen vergleichen oder auch mit einer zweiten Datei.
- Checksum Folders (Siehe Checksum): Macht das gleiche mit Ordner, Prüfsummen können gesichert und später verglichen werden (zum Beispiel zur Erkennung von „Bitfraß“)
- Duplicate Manager Pro, DuplikitPro: Klassische Duplikatsuchen, die aber im Gegensatz zu den meisten anderen auch die Suche anhand der Prüfsumme erlauben. Bin ich erst vor kurzen drauf gestoßen, weil ich nach dem Erscheinen der M1-Macs noch mal intensiv nach Alternativen zu Treesize gesucht habe (das setze ich immer mal wieder ein, aber zumindest für diese Funktion brauche ich es nun wohl nicht mehr).
- Zum syncen von Dateien können Syncovery und/oder Chronosync wertvoll sein, besonders auch, wenn man zwischendurch Backups das Bearbeitungsstandes erzeugen möchte, ohne gleich wieder Chaos zu erzeugen.
- Für das gezielte Umbenennen samt Rückgängig machen, kann A Better File Rename wertvoll sein (Schade, wenn der Ordnervergleich nur daran scheitert, dass man mal ein anderes Namenssystem hatte und die Dateien deshalb nicht als Duplikate erkannt werden).
Aber hier immer schön vorsichtig sein, damit nicht noch mehr Chaos entsteht
- Ebenso kann für die Korrektur von Zeitabweichungen das Tool A Better Finder Attributes wertvoll sein

Mir ist übrigens klar, dass es für den ein oder anderen Vorgang günstigere Varianten gibt, die man tw. sowieso hat (Forklift wäre so ein Beispiel).
Aber für mich gilt hier, dass ich irgendwann erkannt habe, wie viel Zeit das ganze bindet und davon will ich weg.Man darf ja nicht vergessen, dass es je nach Datenbestand nichts ist, was man mal eben erledigt. Und alles, wo man lange dran sitzt und es nicht am gewünschten Tag fertig stellt, muss man ein paar Tage/Wochen später wieder aufnehmen.
Wenn es mir ein paar Sonnentage oder nette Verabredungen „rettet“, ist mir das auch Geld wert.
Die Toolliste ist also nur nett gemeint, man braucht das nicht alles und ich würde das auch ungern diskutieren (Anregungen sind natürlich immer nett). Ist halt „mein Weg“ ;)

Ich würde in der Tat erst aufräumen, denn Duplikate in Devonthink kannst Du eigentlich nur innerhalb DT beseitigen, ohne im ganz schlechten Fall die Datenbank zu riskieren. Machst Du das mit DT, musst Du (leider!) auf die Prüfsumme verzichten. Das kann ein Vorteil sein, wenn man zum Beispiel Texte mit nur kleinen Abweichungen hat (Versionen), aber nicht, wenn man schon am Wildwuchs erstickt.
Eagle Filer geht da anders vor, unter anderem deshalb habe ich ihn mir am Black Friday zugelegt, einfach um mir das mal anzuschauen (und vielleicht für Teilbereiche auch dauerhaft einzusetzen).
Vielleicht stellst Du ja bei der ganzen Aktion auch fest, dass Du sehr gut ohne weiteres Tool (DT oder EF) auskommst.


Hier nochmal aktualisiert der Grund meiner Anfrage:
Es geht um ein Logistik-Problem:

Ziel: Dateien zusammenführen, Duplikate finden (spezifiziert), Bestand reduzieren, mit wenig Verschachtelung übersichtlicher ordnen und dabei umbenennen.
Frage: Was spricht gegen diese Reihenfolge?
  • Zusammenführen der Dateien auf ein Volume, um Bestand zu überblicken (.key,.pages,.docx,.pdf,.odt,.odp,.jpg,.tiff, ... aus iCloud Drive, mehreren Festplatten, USB-Sticks, Rechner - iCloud Drive oder eine externe Festplatte verwenden?)
  • Duplikate finden und reduzieren (hier könnte die Maßgabe sein, die früheste Datei, die Größte Datei und die letzte Datei zu behalten, dann hätte man zumindest eine Reduktion von 10 auf 3, aber in welcher Reihenfolge geht man vor?)
    • gleicher Inhalt differente Größe/Bearbeitungsstand (Masterdatei, Bearbeitung)
    • gleicher Name differenter Inhalt/Größe/Bearbeitungstand (Fortsetzung, Korrekturfassung, niedrige Auflösung)
  • Vorhandene verschachtelte Ordnerstruktur auflösen
  • Neuordnung in Ordnerstruktur mit maximal 2 Ebenen:
    • Schreibtisch/Privat/Themen xyz
    • Schreibtisch/Recherche/Themen xyz
    • Schreibtisch/Beruf/Themenxyz
  • Umbenennen der bereits geordneten Dateien
Anregungen für besseres Vorgehen (in Schritten) erwünscht, vielleicht habe ich nicht alles bedacht?

Danke für die vielen Tipps!
Das hört sich nicht so verkehrt an und man merkt, dass Du Dich damit auseinander gesetzt hast.
Ich würde (aus dem Stehgreif geschrieben):
- Kaffeevorräte auffüllen
- alle Dateien zusammenführen (dorthin verschieben, keine neuen Duplikate anfertigen)
- um auf Nummer sicher zu gehen (abhängig davon, um welche Dateitypen es geht und wie sehr Berechtigungen reinhauen können) vielleicht vom Ausgangsort an die zentrale Stelle rüberkopieren und wenn das funktioniert hat an das Backup (zweiter zentraler Ort) verschieben. Als Zielort für die spätere Bereinigung könnte sich evtl. eine SSD anbieten.
- Wenn das alles getan ist, Zentralen Ort mit dem Backup vergleichen (z.B. mit Beyond Compare)
- Nach vorherigen Schritten einen großen Kaffee kochen, durchschnaufen und mit dem Schicksal hadern, weil man sich im Gegensatz zu vielen anderen Leuten Mühe macht, Dinge zu archivieren, die man vermutlich nie wieder braucht ;)
- Nun würde ich pauschal nach Duplikaten suchen und dabei versuchen, bestimmte Schemen zu erkennen.
Viele Ordner wiederholen sich einfach und dummerweise machen Sie es dauerhaft unübersichtlich, weil alle Suchtreffer endlos werden.
- Die Ordner, die identisch wirken, würde ich mit Beyond Compare abgleichen. Sind sie es, gleich weg mit einem der beiden ;)
- So kann man eine Art „Ping Pong“ zwischen Ordnern spielen. Zwischendurch, so nach paar Wochen, sollte man mal zum Arzt gehen, weil wenig Schlaf und viel Kaffee nicht unbedingt gesund sind.
- Ich würde immer mal wieder den aktuellen Stand sichern, dabei wichtig: Ein Tool (z.B. Chronosync), was am Backup-Ziel auch die Löschungen ausführt. Sonst geht der Sch... wieder von vorne los ;)
- So würde ich den Datenbestand erst mal bereinigen
Danach kommt es darauf an, wie viele „fast“ gleiche Dateien da sind und wie man weiter vorgehen will. Ich habe mich bewusst für Devonthink entschieden, dann fallen viele Operationen auf Dateiebene weg (Tagging etc.)
Das können wir aber gern noch mal aufgreifen, nun muss ich mal kurz andere Dinge „angreifen“ (u.a. natürlich Kaffee).

Mir ist übrigens klar, dass man viele der Vorgänge auch anders gestalten kann, aber meine Beweggründe für das eine oder andere Vorgehen sind tw. so speziell, dass ich nicht alles aufführen kann. Abe rich würde mich freuen, hier auch Erfahrungen zu lesen, von denen ich ggf. profitieren kann.
 
Oben Unten