Dateien umbenennen mit Hazel, Datum aus pdf in Dateinamen übernehmen

VT750

VT750

Aktives Mitglied
Thread Starter
Dabei seit
21.11.2010
Beiträge
519
Reaktionspunkte
24
Moin meine lieben MacUser,
heute habe ich mal wieder ein kleines Problem, welches ich mit euer Hilfe
lösen möchte.

Es geht um das automatische umbenennen von gescannten pdf Dateien.

Die Dateien liegen in meinem erstellten Eingangsordner und tragen Namen wie
z.B. XY0001.pdf. Dieser Name ist natürlich nicht sehr aussagekräftig. Ich
möchte die Dateinamen automatisch ändern. In vielen Dokumenten steht ja ein
Datum. Dieses Datum soll in den Anfang des Dateinamen, aus dem Absender des
Schreibens soll nun auch der Name und im Anschluss noch ein Betreff in den
Dateinamen übernommen werden.

Beispiel: Rechnung von der Versicherung XY, Rechnungsdatum ist der
25.7.2013 (eingescannt z.B. erst am 7.08.2013), Absender ist die
Versicherung XY und der Betreff ist Haftpflichtversicherung. Der zu
erstellende Dateiname sollte dann wie folgt aussehen:
2013-07-25-XY-Haftpflicht (oder kurz Phv).

Diese Umbenennung sollt doch mit Hazel zu schaffen sein.

Mein Workflow bisher: Dokument eingescannt (OCR). In Hazel habe ich
folgendes eingegeben(nur um das Datum auszulesen):

(Contents) (contain matches) (Date match) [(Token erstellt) 31/12/1999]
(Contents) (contain) (XY)

(Rename) (Date match)-XY-(extension)

Hazel durchsucht die pdf und schreibt dann ein wildes Datum in den
Dateinamen. Im versuch hat er eine Zahlenkombination aus der Kontonummer
genommen (diese steht in der Fußzeile im Kleingedruckten). Was mach ich
falsch?

Ich muss erwähnen, ich bin absoluter Hazel newbie bin und mein Englisch
ist, was die Anleitungen aus dem Netz betrifft nicht sehr hilfreich.


Gruß Matthias
 
Das habe ich so getestet. Es kam aber nur ein wildes Datum bei raus, welches Hazel aus der Kontonummer generiert hat.
 
Du mußt das OCR ´te Dokument kopieren (den Inhalt, nicht die Datei) und dann in einen Texteditor einfügen.
So sieht dann Hazel das Dokument.
Bei der Erstellung des Datum Tokens wird am Ende der Regel gefragt an wievielter Stelle das zu erkennende Datum von oben oder unten steht.(Falls mehrfach vorhanden, und ein bestimmtes genommen werden soll).
Die Formatierung des Datum Tokens muss exakt der Form entsprechen wie es in der Textdatei dargestellt wird.
Erst beim Renaming darfst du selbst kreativ werden.
So sollte es funktionieren. Zumindest bei mir macht es das.
Lade dir noch das neueste Hazel Update herunter.
 
Werde es Testen, danke für den Tip mit dem Texteditor.

Edit:
Wenn ich die Dokumente bekomme werden sie vor dem Scannen gesichtet. Ich könnte doch bestimmte Stellen (Datum, Absender, Betreff) mit einem Textmaker kennzeichnen und diese dann beim Scannen schon als Schlagworte für das pdf benutzen. Diese Schlagworte könnten dann für den Dateinamen herhalten oder?
 
Ich habe das bei mir an Hand des Videos mit einigen Rechnungen getestet; es funktioniert einwandfrei. Ich habe für jeden Dokumententyp (Handy-Rechnung, Strom-Rechnung, etc.) eine eigene Regel definiert. Ich lasse Hazel aber nicht nur nach dem Datum suchen, sondern nehme den Text davor auch mit, also z.B. "Rechnungsdatum: 31.10.2013" (siehe Grafik); als eideutige ID für diesen Dokumententyp lasse ich Hazel z.B. nach der Kundennummer suchen.
Bei Amazon Rechnungen funktioniert das leider nicht, obwohl ich die PDF's mit DEVONThink als OCR konvertiere. Ich vermute mal, dass Hazel das nicht lesen kann, weil zu klein oder fette Schrift, oder was weiß ich...
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: VT750
Toll, ich Rind habe die die Punkte zwischen TT.MM.JJJJ nicht geschrieben.
So geht es auch!
Danke!
 
Moin zusammen,

ich greife das Thema nochmal auf, da ich 6 Jahre später genau dies auch erreichen will :) Dank an den Threadersteller. Allerdings hab ich noch kein Hazel. Das werde ich mir kaufen.
Brauche ich denn nur Hazel für den Workflow?
Mein Ziel ist es - genau wie oben - aus einem eingescannten Dokument (OCR) von einem Brief das Datum in den Dateinamen zu schreiben. Das wäre echt mega, wenn das so funktioniert!
 
Bei der Erstellung des Datum Tokens wird am Ende der Regel gefragt an wievielter Stelle das zu erkennende Datum von oben oder unten steht.(Falls mehrfach vorhanden, und ein bestimmtes genommen werden soll).
die Erläuterung ist zwar schon 6 Jahre alt, sollte aber noch heute gelten (?)
bei meinen Gebührenbescheiden tauchen gefühlt 20 Datumsangaben auf, wie kann ich dann genau das richtige RE-Datum herausfischen ?
Im PDF als auch Texteditor taucht das gewünschte RE-Datum erstes (im entsprechenden Format) auf, er nimmt trotzdem immer das zweite. Unterschiedliche Einstellungen bei "1st, 2nd ... von oben/unten" haben auch nix gebracht ...

@Sharptype
wenn du in deinen Vorlagen nur ein Datum hast, geht es definitiv und einfach; ich kämpfe momentan noch bei der Erfassung im Falle von mehreren Daten (s.o.)
 
ich kämpfe momentan noch bei der Erfassung im Falle von mehreren Daten (s.o.)
Hey. Das habe ich mittlerweile auch hinter mir. Ich habe mir Hazel auch gekauft und bin damit super zufrieden. Das Problem mit dem Datum habe ich auch. Ich habe mittlerweile Kontakt mit dem Entwickler aufgenommen. Mein Wunsch generell ist, nur nach bestimmten Stichworten oder Datumsangaben ausschließlich auf der ersten Seite des PDFs zu suchen. Die Funktion eine bestimmte Instanz zu verwenden, hilft mir dafür leider nicht weiter. Das angefragte Feature von mir soll eventuell in den nächsten Versionen zur Verfügung stehen.
 
Hallo liebes Forum,
auch ich bin jetzt auf Hazel aufmerksam geworden. Hazel ist eine absolut geniale Erweiterung für den Mac.
Einfache Aufgaben lassen sich leicht als Rule einrichten. Jedoch scheitere ich daran eine Rule zu erstellen, die das Datum aus dem Text der Datei ausliest und in den Dateinamen einträgt. Ich bin bei Hazel blutiger Anfänger und die Videos und Bilder die hier verlinkt waren gibt es leider nicht mehr.
Ich wäre euch echt dankbar, wenn ihr mir ein paar Tips oder Screenshots zu dem Thema posten könntet. Gibt es noch weitere Tips zum automatischen Eintragen des Dateinamen?
Vielen Dank
Ciao Holger
 
Jedoch scheitere ich daran eine Rule zu erstellen, die das Datum aus dem Text der Datei ausliest und in den Dateinamen einträgt. die Videos und Bilder die hier verlinkt waren gibt es leider nicht mehr.
das oben verlinkte Video ist nach wie vor abrufbar - und macht EXAKT das, was du willst/suchst.
tricky wird es dann, wenn es mehrere bzw. verschiedene Datumsangaben, hier das richtige zu bestimmen
.oO(und ansonsten muss das PDF natürlich lesbar sein (OCR)
 
Hallo matisse,
danke für deinen Hinweis. Ich habe das Video jetzt gefunden was mir sehr geholfen hat. Die Funktion hat jetzt auch bei mir geklappt.
Hazel bietet eine nahezu unüberschaubare Menge an Einstellmöglichkeiten. Ich würde mir eine Übersicht mit Ideen und Vorschlägen wünschen, was man mit Hazel noch so machen kann. Kennt jemand eine Internetseite wo man so etwas findet?
Danke und liebe Grüße
Holger
 
Zurück
Oben Unten