OCRKit Pro script für Hazel

K

Krabbler

Mitglied
Thread Starter
Dabei seit
23.10.2018
Beiträge
90
Reaktionspunkte
60
Hallo,

ich habe ein Problem mit der Erstellung eines Scripts für OCRKit im Programm von Hazel.
Damit ich eine gescannte PDF per Hazel automatisch mit ODRKit durchsuchbar und passend ablegen kann,
habe ich ein Script gefunden.
Hier ist jedoch der Fehler, daß bei der Zeile: repeat while performing ocr
das "ocr" mit der Fehlermeldung : Zeilenende gefunden, aber Identifier gefunden nicht angenommen wird.
Was müßte ich da ändern?

Gruß
Krabbler
 
So habe ich’s in Hazel umgesetzt

AppleScript

Code:
tell application "OCRKit"
    launch
    open theFile
end tell
 
Danke für den Tipp, jedoch wenn ich dieses Script in Hazel eingebe, läuft die Texterkennung in Dauerschleife.
D.h. die _OCR Anhängung wiederholt sich ständig: MeinHaus_OCR.pdf - MeinHaus_OCR_OCR.pdf etc.

Hazel.log:
2018-10-24 05:28:05.766 hazelworker[1226] ###main load address: 0x10f64c000
2018-10-24 05:28:05.767 hazelworker[1226] ###Noodle load address: 0x10f772000
2018-10-24 05:28:05.767 hazelworker[1226] ###CK load address: 0x10f735000
2018-10-24 05:28:05.798 hazelworker[1226] Processing folder 1. NextBox
2018-10-24 05:28:07.805 hazelworker[1226] 20180914_MeinHausOCR-OCR-OCR.pdf: Rule Copy of Copy of Copy of Copy of ocrkit matched.
2018-10-24 05:28:11.998 hazelworker[1226] Done processing folder 1. NextBox

@.maxx
wie hast Du denn die komplette Regel in Hazel angelegt?

Oder hat es etwas mit Mojave os zu tun?

Gruß Krabbler
 
Zuletzt bearbeitet:
So, ein Stückchen weiter.
Schalte ich in den Einstellungen von OCRKit den Zusatz "OCR Anhängen" aus, wird einmal die durchsuchbare Datei erstellt und das Programm läuft nicht mehr endlos weiter.
Das ist aber insofern suboptimal , da ich nachdem die Datei lesbar, diese weiter von Hazel verschieben lassen möchte.
Durch den Anhang -OCR konnte ich so eine neue Regel definieren, damit nicht z.B. mehrere Dokumente gleichzeitig verschoben werden.

Möchte ich jedoch die Datei weiterleiten, habe ich auch ohne -OCR Anhang diese Endlosschleife....:koch:

Könnte man mittels Script diese Dauerschleifen Einbremsen? Hätte der jemand eine gute Idee?

Gruß Krabbler
 
Zuletzt bearbeitet:
Also ich habs so in Hazel eingerichtet:

1. Eingehende Briefe scanne ich als jpg in einen Ordner
2. hier greift das OCRKit Script von oben mit Voraussetzung „Extension = jpg“
3. OCRKit konvertiert auch in pdf
4. anschließend verschiebt Hazel die fertigen pdfs in einen anderen Ordner in dem dann weitere Automationen stattfinden z.b sortieren nach Nachname
 
Laut einer kurzer Recherche kann dieses Hazel auch Shell Skripte ausführen. Du könntest also beispielsweise das Terminal-Programm OCRmypdf (installierbar über homebrew) in einem Shell-Skript verwenden. Und danach im selben Shell-Skript auch die Datei verschieben lassen.
 
@Haskelltier
Vielen Dank für Deinen Rat, aber über ShellScript oder Homebrew hab ich null Ahnung.
Sicher mag es auch mehrere verschieden Programme geben , die mir in dieser Sache helfen, nur für was hab ich OCRKit dann geholt?
Ich habe mich auch schon an den Support von Exactcode (ODRKit) gewandt.
Leider bleiben die Mails unbeantwortet , deswegen mein Versuch, hier in diesem Forum Menschen zu finden, die ähnliche Schwierigkeiten haben und diese evtl. lösen konnten.
Für mich fragwürdig ist diese Dauerschleife, würde man schon mal den Grund dazu wissen, käme man etwas weiter.

@.maxx

Ich probiere das gerne mal so aus, wie Du es verwendest. Der Witz, ich hab mir Mojave 3 mal neu aufgespielt und nun ist meine Lizenzaktivierung meines IX500 überschritten.
Diese muß ich mir jetzt erst von Scan Snap freischalten lassen, wann die sich jedoch wieder melden steht in den Sternen.

Gruß Krabbler
 
Was willst du denn genau machen? Wenn du einfach nur alle pdf-Dateien in einem bestimmten Ordner ocren willst un die Ergebnisse in einem zweiten Ordner speichern willst, ist das nicht besonders schwierig umzusetzen.
 
Fein, dann gib mir mal ne Anleitung die ich umsetzen kann mit meinem Mac. Und vllt. so, das ich nicht noch zig Sachen donwladen muß, wo ich auch nix Versteh.
Mit dem Applescript und OCRKit, konnte ich das mit meinen bescheidenen Kenntnissen und für meine Bedürfnisse einfachst bewerkstelligen.
Falls Du eine adäquate Alternative hast....nur zu.

Gruß Krabbler
 
@Haskelltier
[...]Der Witz, ich hab mir Mojave 3 mal neu aufgespielt und nun ist meine Lizenzaktivierung meines IX500 überschritten.
Diese muß ich mir jetzt erst von Scan Snap freischalten lassen, [...]

Was für eine Lizenzaktivierung? Benutzt Du das neue "ScanSnap Home" oder den alten "ScanSnap Manager"?
 
@Twoflowers
Auf Mojave geht bei mir nur "ScanSnap Home", ergo da muß ich mich registrieren . Und da ich Mojave schon mehrmals aufgespielt habe, war's vorbei mit der Herrlichkeit.
Nun wart ich bestimmt ne Ewigkeit, bis Fujitsu mich wieder freischaltet. Nen Scanner für 400 Tacken und die machen Lizenzspielchen:confused:.
Und bis man da erstmal den passenden Support gefunden hat, ist echt aufregend!!
 
Laut einer kurzer Recherche kann dieses Hazel auch Shell Skripte ausführen. Du könntest also beispielsweise das Terminal-Programm OCRmypdf (installierbar über homebrew) in einem Shell-Skript verwenden. Und danach im selben Shell-Skript auch die Datei verschieben lassen.

Das konnte OCRKit früher auch im Shell Skript. "Früher" schreibe ich, weil ich das lange nicht mehr gemacht habe. Gehr heute vielleicht noch genauso. Mein Skript (das man in Hazel nach Anpassung verwenden könnte) sah so ähnlich wie das hier aus:

----------------------- schnipp ------------------------
#!/bin/bash
ocrkit=/Applications/OCRKit.app/Contents/MacOS/OCRKit
new="neuer Dateiname"
old="alter Dateiname"
$ocrkit --lang de --format pdf --no-progress --output "$new" "$old"
----------------------- schnapp ------------------------

Für "ocrkit" muss der Pfad zur OCRKit App gesetzt werde
Für "old" und "new"müssten die entsprechenden Dateinamen gesetzt werden.
 
@Twoflowers
Auf Mojave geht bei mir nur "ScanSnap Home", ergo da muß ich mich registrieren . Und da ich Mojave schon mehrmals aufgespielt habe, war's vorbei mit der Herrlichkeit.
Nun wart ich bestimmt ne Ewigkeit, bis Fujitsu mich wieder freischaltet. Nen Scanner für 400 Tacken und die machen Lizenzspielchen:confused:.
Und bis man da erstmal den passenden Support gefunden hat, ist echt aufregend!!

Das ist ja ein Mist. Ich nutze auf Mojave immer noch den ScanSnap Manager, allerdings mit einem IX100. Läuft problemlos.
Den ScanSnap Home hatte ich mal in einer VM getestet. Wenn ich mich recht erinnere, konnte man die Lizenzierung über einen Menüpunkt auch wieder zurücknehmen. Aber dafür ist es jetzt bei Dir wahrscheinlich zu spät, wenn Du ihn nicht mehr aktiviert bekommst. Ärgerlich, dass die sich so ein blödes Verfahren ausdenken.
 
Was muß ich bei den Dateinamen angeben?
 
Was muß ich bei den Dateinamen angeben?

Im Script müsste (denke ich) der volle Pfad angegeben werden:

old="/Users/mustermann/ordner/meindokument.pdf"
new=/Users/mustermann/ordner/meindokument_ocr.pdf
 
Schau mal drüber:

#!/bin/bash
ocrkit=/Applications/OCRKit Pro.app/Contents/MacOS/Maus/Programme/OCRKit Pro.app
old="/Users/Krabbler/Desktop/InBox/1. NetBox/Test.pdf"
new="/Users/Krabbler/Desktop/InBox/1. NetBox/Test_ocr.pdf"
$ocrkit --lang de --format pdf --no-progress --output "$new" "$old"


Bekomme das Hier von Hazel :

2018-10-26 20:21:23.967 hazelworker[12662] Test.pdf: Rule Copy of Copy of Copy of Copy of Copy of Copy of Copy of Copy of ocrkit matched.
2018-10-26 20:21:23.982 hazelworker[12662] [Error] Shell script failed: Error processing shell script on file /Users/Krabbler/Desktop/InBox/1. NextBox/Test.pdf.
2018-10-26 20:21:23.982 hazelworker[12662] Shellscript exited with non-successful status code: 127
 
Zuletzt bearbeitet:
Folgendes bash-Skript ocrt (mit ocrmypdf) alle pdf Dateien in ./Quelle, legt die Ergebnisse in ./Ziel (mit gleichem Dateinamen) ab und löscht danach die Dateien aus ./Quelle:

Code:
#!/bin/bash

source=./Quelle
dest=./Ziel

find "$source" -type f -iname "*.pdf" | while read filepath
do
    filename=$( basename "$filepath" )
    destpath="$dest"/"$filename"
    ocrmypdf "$filepath" "$destpath"
    rm "$filepath"
done

Ob und wie das mit Hazel zusammen funktioniert müsste allerdings irgendwer anders herausfinden.
 
Ich scheitere schon an dem ShellScript von Twoflowers...was meinste, was jetzt mit deinem passiert?
Trotzdem Danke für Deine Hilfe.
 
meines erachtens liegt der fehler in der kombination, die pdf-ocrs auch in den hazel-überwachten folder zu schreiben.
 
Seltsamerweise funktionierte das Ganze unter High Sierra problemlos.
Nur dummerweise habe ich den Originalscript nicht mehr. Das eigentliche Problem ist halt diese Endlosschleife, wenn wir wissen, was diese auslöst, könnte man das problem sicher lösen.
 
Zurück
Oben Unten