Solide OCR Software für Mac OS

Hippias

Neues Mitglied
Thread Starter
Dabei seit
21.03.2021
Beiträge
5
Reaktionspunkte
0
Hallo zusammen,

ich bin auf der Suche nach einer OCR Software für Mac OS.

Eigentlich habe ich nur zwei Anforderungen:
  1. Vorhandene PDF Dokumente (mehrseitig) sollen durchsuchbar gemacht werden (keine Scanner Software mit OCR Option).
  2. Es sollte machbar sein, möglichst viele PDF Dokumente im Batch zu bearbeiten.
Die Software darf auch Geld kosten. Bis 100 € finde ich für eine solide Lösung vertretbar. Gleich ein Dokumentenmanagementsystem einzusetzen scheint mir etwas überzogen. Aber wenn es dies mit dem gewünschten OCR Funktionsumfang bis 100 € gibt, nehme ich auch das gerne.

Kann mir jemand etwas empfehlen?

Vielen Dank!
 
Abbyy Finereader pro für Mac (gibt's auch für Windows) - https://pdf.abbyy.com/de/
Ist bei mir in der pro-Edition von DevonThink enthalten, bin sehr zufrieden damit....
 
  • Gefällt mir
Reaktionen: Bozol und dreilinger
Der Abbyy FineReader unterstützt allerdings Big Sur nicht, sollte man beachten
 
pdfsandwich: http://www.tobias-elze.de/pdfsandwich/

Ist ein Kommandozeilenprogramm, läuft per Homebrew auch auf dem Mac.

Bei mir läuft es in einer VM auf dem NAS und und macht einmal täglich per cronjob OCR mit allen PDFs, die vom Scanner (Multifunktionsdrucker) in ein bestimmtes Verzeichis geliefert werden, das Datum bildet den Dateinamen.
Folgendes Skript überprüft, ob der Dateiname "ocr" enthält. Wenn nicht, wird die Datei mit pdfsandwich behandelt, dieses hängt dann "ocr" an den Dateinamen der neu erzeugten Datei an. Dateien, die schon "ocr" enthalten, werden ignoriert bzw. nicht neu behandelt und die Orginaldatei nach dem OCR gelöscht.

Code:
#!/bin/bash

dir="/Pfad/zum/Scannerverzeichnis"

for file in ${dir}/*
do
    if [ -f $file ] && [ "$file" != *ocr* ]; then
        pdfsandwich -gray -nthreads 4 -lang deu -grayfilter "$file"
        rm "$file"
    fi
done

Überhaupt die Erkenntnis: Bei mir funktionert das papierlose Büro nur dann, wenn der Benutzungsaufwand extrem gering ist - ich will nicht bei jedem Fetzen Papier das reintrudelt jedesmal den Scanner einschalten, ein Programm starten und irgendwo drauf rumklicken. Ich hab' daher auf dem Multifunktionsdrucker mit dem Stapeleinzugs-Scanner eine Direktfunktionstaste damit belegt, die Scans direkt an besagtes Verzeichnis auf dem NAS zu schicken. Der Aktenvernichter steht gleich neben dem Scanner-MuFu...

Ach ja: Mir ist erst vor kurzem aufgefallen, daß die OCR-Dateien auf dem NAS von diesem (Synology) auch indiziert werden können:

https://www.macuser.de/threads/finder-suchfunktion-findet-datei-inhalte-auf-synology-nas.874873/

Damit kann man direkt im Finder (mit der Spotlight-Funktionalität) nach Dokumenteninhalten auf dem NAS suchen...
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Mihahn, BalthasarBux und Felyxorez
Hmmmm... bei mir läuft es unter BigSur (zumindest unter DEVONthink)....
Das ist ja ein anderes Produkt, das „nur“ die Engine nutzt. Aber es hat da ja irgendwann mal einen Hinweis gegeben, dass es eine Aktualisierung gab, vielleicht hat sich dann ja auch wwas beim „original“ getan.
Wenn er/sie den Preis verdoppeln kann, würde ich auch zu Devonthink raten, da hat man gleich noch zusätzlichen Nutzen davon, dass die Texte erkannt wurden.

Wenn Student(in), Dozent(in), etc. wäre auch Adobe Acrobat im Rahmen des veranschlagten Preises.
 
Auch ich würde PDFify nennen. Gibt es sowohl im Mac App Store als auch hier:
https://pdfify.app/de/

Lass dich nicht vom Abo abschrecken. Der deutsche Entwickler bietet auch eine Lebenslange Lizenz für 25 EUR an.
 
Ist schwer zu finden.
PDF Expert 3. Bei Click auf Buy wird dann der neue Preis angezeigt: 95€ inkl. Märchensteuer.
 
Zurück
Oben Unten