OCR Software für gescannte PDF-Dokumente gesucht.

pinpit

pinpit

Aktives Mitglied
Thread Starter
Dabei seit
15.12.2010
Beiträge
274
Reaktionspunkte
26
Hallo,

habe mir vor einiger Zeit die Software Prizmo für die Texterkennung (OCR) gekauft, leider bin ich mit der Texterkennung nicht so ganz zufrieden. Es schleichen sich sehr häufig Fehler ein.

Bin jetzt kurz davor auf ABBYY Fine Reader Pro umzusteigen, hab gehört, dass dort das OCR recht gut funktioniert. Bevor ich jetzt wieder einen Fehlkauf tätige wollte ich euch mal fragen, ob es hier jemanden gibt, der regelmäßig mit dem Programm arbeitet und wie gut die Texterkennung dabei ist.

MFG
 
Ich nutze hierfür PDFScanner, funktioniert einwandfrei und ist günstig.

Abbyy kannst du ja testen, mir war es zu umfangreich.
 
  • Gefällt mir
Reaktionen: iPhill
Nutze hierfür die kostenlose Software "PDF OCR X Community Edition"

Bis jetzt sehr zufrieden damit. Der Tipp hierzu kam auch aus diesem Forum...
 
  • Gefällt mir
Reaktionen: iPhill
Ich benutze FineReader OCR Pro und bin sehr zufrieden mit den Ergebnissen.
Meine komplette papierlose Ablage/Büro läuft über FineReader.
 
  • Gefällt mir
Reaktionen: iPhill
Ich habe vor kurzem angefangen
Pdfify zu testen, weil ich durchsuchbare PDF auf dem iPad Pro haben wollte.

Dafür, dass es kostenfrei ohne Einschränkungen genutzt werden kann, bin ich bisher recht zufrieden mit den Ergebnissen.

Gibt es auch im Apple AppStore.
 
  • Gefällt mir
Reaktionen: picknicker1971
Danke für die Tipps! Hab mir jetzt Pdfify kostenlos installiert, die Texterkennung dauert sehr lange, aber scheint ganz gut zu funktionieren.
 
Hallo,

habe mir vor einiger Zeit die Software Prizmo für die Texterkennung (OCR) gekauft, leider bin ich mit der Texterkennung nicht so ganz zufrieden. Es schleichen sich sehr häufig Fehler ein.

Bin jetzt kurz davor auf ABBYY Fine Reader Pro umzusteigen, hab gehört, dass dort das OCR recht gut funktioniert. Bevor ich jetzt wieder einen Fehlkauf tätige wollte ich euch mal fragen, ob es hier jemanden gibt, der regelmäßig mit dem Programm arbeitet und wie gut die Texterkennung dabei ist.

MFG
Hier: https://www.macuser.de/threads/der-ich-suche-eine-ios-app-thread-2.674463/page-57#post-10273123

;)
 
Acrobat Reader Pro macht auch OCR.
 
Moin,
Der Vollständigkeit halber:
Die kostenpflichtige Version von Adobe Reader (Adobe Acrobat) kann natürlich auch OCR und es gibt eine (Android) App zum Scannen.
Wenn man ein entsprechendes Adobe Abo hat ist das Programm ggf. mit drin.
 
Ich hatte vor einer Weile diverse OCR-SW getestet und war mit keiner zufrieden. Keine hatte eine vertrauenswürdig niedrige Fehlerrate. Mal abgesehen davon, daß fast alle selbst bei Wörtern, die im Dictionary sein müssten, falsche Zeichen erkannt haben, scheiterten eigentlich alle am entscheidenden Punkt: Vorgangsnummern, Kundennummern etc.

Wenn ich verlässlich Dokumente wiederfinden möchte, MÜSSEN derartige Nummern zweifelsfrei korrekt erkannt werden. Das Problem wäre geringer, wenn die PDF-Reader auf macOS wenigstens Fuzzy-Suche könnten. Ok, der Adobe Reader kann es, aber ich weigere mich den zu benutzen, wenn es nicht irgendwie notwendig ist. Als Standard will ich den nicht.

Ich hatte das mit diversen Scan-Parametern (DPI, Farbbereich, Helligkeit) probiert. Die Scans kommen aus einem Canon ScanFront 220 (ADF Netzwerk-Scanner). Wenn ich mal ein bisschen Luft habe, probiere ich es nochmal. Vielleicht hat sich in den letzten 2-3(?) Jahren da ja noch was getan.
 
Ich hatte vor einer Weile diverse OCR-SW getestet und war mit keiner zufrieden. Keine hatte eine vertrauenswürdig niedrige Fehlerrate. Mal abgesehen davon, daß fast alle selbst bei Wörtern, die im Dictionary sein müssten, falsche Zeichen erkannt haben, scheiterten eigentlich alle am entscheidenden Punkt: Vorgangsnummern, Kundennummern etc.

Wenn ich verlässlich Dokumente wiederfinden möchte, MÜSSEN derartige Nummern zweifelsfrei korrekt erkannt werden. Das Problem wäre geringer, wenn die PDF-Reader auf macOS wenigstens Fuzzy-Suche könnten. Ok, der Adobe Reader kann es, aber ich weigere mich den zu benutzen, wenn es nicht irgendwie notwendig ist. Als Standard will ich den nicht.

Ich hatte das mit diversen Scan-Parametern (DPI, Farbbereich, Helligkeit) probiert. Die Scans kommen aus einem Canon ScanFront 220 (ADF Netzwerk-Scanner). Wenn ich mal ein bisschen Luft habe, probiere ich es nochmal. Vielleicht hat sich in den letzten 2-3(?) Jahren da ja noch was getan.
etwas off topic, aber bei youtube gibt es einen sehr aufschlussreichen Vortrag "traue keinem scan den du nicht selbst gefälscht hast"
 
Wenn ich verlässlich Dokumente wiederfinden möchte, MÜSSEN derartige Nummern zweifelsfrei korrekt erkannt werden.

FineReader erkennt Texte & Nummern (eine ordentliche Vorlage/Scan/Kontrast/... vorausgesetzt) sehr gut. Bei kleineren Texten muss entsprechend die Auflösung angehoben werden. 600DPI hat bei mir bis jetzt immer gereicht, auch für FIneprint wie AGBs von Versicherungen.
Auch Bar/QR-Codes werden erkannt
 
@picknicker1971: ich werde dann wohl demnächst mal meine nächste Testrunde drehen.
 
Ich nutze hierfür PDFScanner, funktioniert einwandfrei und ist günstig.

Abbyy kannst du ja testen, mir war es zu umfangreich.


Ich nutze u.A. Abbyy Finereader (ich finde allerdings das einige Funktionen fehlen die ich gerne darin hätte, darum brauch ich noch PDF-Xchange Editor) Die Texterkennung funktioniert gut. Ich scanne aber meist auf 600 DPI in Schwarz/Weiß ein.
 
Ich nutze u.A. Abbyy Finereader (ich finde allerdings das einige Funktionen fehlen die ich gerne darin hätte, darum brauch ich noch PDF-Xchange Editor) Die Texterkennung funktioniert gut. Ich scanne aber meist auf 600 DPI in Schwarz/Weiß ein.
Mit welchem Scanner wenn ich fragen darf und wie lange (also ich meine Erkennung) dauert bei Dir ein Scan einer "normalen" DINA4 Seite in 600DPI S/W?
 
Ich habe ein Fujitzu FI-4120C https://www.fujitsu.com/global/prod...scanners/fi/discontinued/fi4120c/fi4120c.html Und mit diesem Dinosaurier dauert das einscannen doch recht lange dank USB 1.1 und SCSI... Aber die neueren Fujitzu FI-7160 die wir auf der Arbeit haben sind Sau schnell. https://www.fujitsu.com/de/products/computing/peripheral/scanners/fi/workgroup/fi7160/ (aber die sind mir zu teuer....).

Das erkennen des Textes dauert mit einem i5 von 2014 nicht lange. Ich bin gerade dabei und habe so eben mal gemessen. 119 Seiten A5 in 29 Sekunden.
 
  • Gefällt mir
Reaktionen: picknicker1971
Zurück
Oben Unten