Script für Ordneraktion - Automatisierter OCR-Scan

:p

ach ja, der ausgabeordner ist auch auf "ocr-out" geändert.
 
dank auch von mir nochmal. genau sowas hab ich gesucht und es funktioniert prima!
 
Hallo Nicoch,

hänge aktuell am selben Problem wie du damals hattest. Könntest du mir da vielleicht etwas weiterhelfen? :)
 
Hallo zusammen, ich grabe diesen Thread nochmal aus, weil ich vor demselben Problem stehe. Ich habe OCRKit erworben und möchte eine Ordneraktion erstellen, die neue Dokumente automatisch durchsuchbar macht. Idealerweise auch einen Dienst, wo ich per rechte Maustaste auf das pdf den OCR-Prozess starten kann. Leider bekomme ich es nicht hin. Betriebssystem ist OS 10.14.2. Kann jemand helfen?
Ich habe OCRKit zur Bibliothek in Apple Skript hinzugefügt, habe aber keine Ahnung, welche der dort verfügbaren Befehle ich wie zusammensetzen muss, damit das Programm seinen Dienst tut...
 
neue version - chatty switch - trash switch - standard/pro app switch - check auf gültige dateitypen - ersetzt code in #21.
Code:
#!/bin/bash
#set -vux
#
# (c) Olivetti 2016
#

...

Hi @Olivetti,

1000 x Danke fürs teilen Deiner Lösung! Habe auch mit OCRkit experimentiert und mich gefragt, wie man das am Besten scripted.

Bin jetzt zwar bei tesseract und imagemagick gelandet, weil mir der Preis zu heftig ist, bzw. ich manche Funktionen nicht benötige.

Bin nicht so geübt mit der bash und habe mir aus Deiner Vorarbeit das hier zusammengebastelt:

Bash:
#!/bin/bash

# https://kapeli.com/cheat_sheets/Bash_Test_Operators.docset/Contents/Resources/Documents/index
# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash

[[ ! -f "${1}" ]] && exit 1

fullpath="${1}"

filename="${fullpath##*/}"
dir="${fullpath:0:${#fullpath} - ${#filename}}"
base="${filename%.*}"
ext="${filename##*.}"

#echo "Directory:" $dir
#echo "File:" $filename
#echo "File without extension:" $base
#echo "Extension:" $ext

/usr/local/bin/convert "${fullpath}" -resize 400% -type Grayscale "${dir}/${base}.tif"
/usr/local/bin/tesseract -l deu "${dir}/${base}.tif" "${dir}/${base}_OCR"

rm "${dir}/${base}.tif"

Vielleicht hilft es ja mal jemand weiter ... ich rufe das Ganze mit "do shell script" per AppleScript auf und übergebe den Pfad zur Bilddatei als Parameter.
 
Der Fine Reader Pro von Abbyy hat inzwischen auch die Schnittstelle für den Automator geöffnet. Ordneraktion ist so in 1 Minute erstellt. Nur als Tipp.

Kostet aber glaub über 100 Tacken.
 
  • Gefällt mir
Reaktionen: mausfang
Zurück
Oben Unten