Scanner-OCR umsonst so gut wie OCR-Original?

wosuli

Neues Mitglied
Thread Starter
Dabei seit
15.12.2005
Beiträge
13
Reaktionspunkte
0
Hallo,

ich scanne nur Texte in schwarz-weiß mit der den Scannern beigefügten kostenlosen OCR-kostenlos-Software, bin aber nicht zufrieden, weil die Texte nicht gut erkannt werden.

Weiß jemand, ob die für eine Menge Geld käuflichen OCR-Programme (z.B. Readiris oder Omnipage) für meine Zwecke (Text in s/w scannen) mehr bringen?

Danke schon mal für die Antwort
Wosuli
 
Moin,
>Scannern beigefügten kostenlosen OCR-kostenlos-Software.
Welche Software wäre das denn ?

Benutze Readiris Pro seit der Version 7, mit der Version Pro 11 und dem HP Scanner 5500c bin ich zufrieden.
 
Bei meinem Canon war das OmniPage SE dabei. Die Texterkennung funktioniert bei einfachem Text recht gut, aber je komplexer der Aufbau desto schlechter das Ergebnis.
 
Das Scanergebnis hängt immer noch maßgeblich von der Qualität der Scanvorlage ab.
Deshalb zunächst mal dort feststellen, ob es daran liegt.
Dann ist ein Graustufenscan statt sw oft in der Qualität besser (falls das mit der Billigsoftware geht) und die Scanauflösung sollte nun nicht gerade 72 betragen.
Wenn bei einer A 4 Seite noch 5 Fehler drin sind, ist das Ergebnis nicht so übel.
Teure Software kann das uU noch besser, will dann aber auch auf die Vorlage trainiert werden.
 
Habt Dank für Eure Hilfe.

Joachim 14, noch ´ne Frage: Ich habe bisher mit dpi 300 gescannt, damit mein Canon 670U nicht zur Schnecke wird. Bringt eine wesentlich höhere Auflösung mehr, z.B. jenseits 1000? 600 und 300 bei mir keinen Unterschied, nur in der Geschwindigkeit.
...und: Wieviele Seiten braucht eine teure Software, bis sie trainiert ist?

Eine Frage auch an DickUndDa: Ich liebäugle tatsächlich mit readiris 11. Mit welchem Scanner und welcher Auflösung arbeitest Du?

Herzlichen Dank
Wosuli
 
wosuli schrieb:
Eine Frage auch an DickUndDa: Ich liebäugle tatsächlich mit readiris 11. Mit welchem Scanner und welcher Auflösung arbeitest Du?

Ich benutze einen Brother DCP-7010 (Scanner und Drucker). Ich bin gerade nicht daheim, kann also nicht nachsehen, aber ich glaube dass es 300 dpi sind.
 
Im Verlag setze ich Omnipage ein. Das tut recht gut seine Arbeit.
 
Lynhirr schrieb:
Im Verlag setze ich Omnipage ein. Das tut recht gut seine Arbeit.

Unter Windows oder unter Mac OS?

Als ich nach einem OCR für den Mac gesucht habe war Omnipage zum einen extrem teuer und zum anderen sehr veraltet.
 
Ich gestehe, das ist ein ganz alter Scannerplatz. G4 Quicksilver 400 Mhz, System 9.x, alter Agfa-Scanner. Die Version von Omnipage weiß ich jetzt gar nicht.

Es werden alte Romanhefte eingesannt. Die Qualität des OCR ist je nach Vorlage mal gut mal weniger gut.
 
wosuli schrieb:
Habt Dank für Eure Hilfe.

Joachim 14, noch ´ne Frage: Ich habe bisher mit dpi 300 gescannt, damit mein Canon 670U nicht zur Schnecke wird. Bringt eine wesentlich höhere Auflösung mehr, z.B. jenseits 1000? 600 und 300 bei mir keinen Unterschied, nur in der Geschwindigkeit.

Mehr als 300 dpi bringen bei normalen Texten nichts. Wenn es ein Canon ist: Kann man da nicht bei der Dokumentart (also noch vor dem Scannen) gleich "OCR-Dokument" oder ähnliches auswählen, so dass gleich passend gefiltert wird? Bei meinem Canon ist das so, und da ist dann die Auflösung fest auf 300 eingestellt. Das Ergebnis ist deutlich besser als bei normalem "Textdokumentenscan" mit manueller Einstellung der sonstigen Optionen.
 
wosuli schrieb:
Joachim 14, noch ´ne Frage: Ich habe bisher mit dpi 300 gescannt, damit mein Canon 670U nicht zur Schnecke wird. Bringt eine wesentlich höhere Auflösung mehr, z.B. jenseits 1000? 600 und 300 bei mir keinen Unterschied, nur in der Geschwindigkeit.
...und: Wieviele Seiten braucht eine teure Software, bis sie trainiert ist?

Leslie hat eben schon das Wesentliche gesagt, mehr als 300 bringt wenig bis nichts. Es sei denn, Du willst das Kleingedruckte scannen. Bei 4 pt Schriftgröße in hellgrau hat vermutlich jede OCR ihre liebe Not.

Das Trainieren hilft Seite für Seite weiter. In Omnipage funktioniert das im Prinzip so: Du siehst eine erkannte Seite durch und sagst (mit Klick), dieses nicht erkannte Zeichen ist ein "m". Beim nächsten Scan erkennt Omnipage dieses bislang nicht erkannte Zeichen dann (hoffentlich) richtig.
Nach 10 Seiten Korrektur sieht es dann schon ganz gut aus.
Leider geht das alles wieder vor vorne los, wenn die Vorlagen anders gedruckt sind, zB mit anderem Schrifttyp.
Das Trainieren lohnt also vor allem, wenn Du große Mengen von gleichartigem Text hast.

Im übrigen ist Omnipage (ich habe es seit langem und dann upgedatet) vermutlich nicht mehr die Technologiespitze, die es mal war. Ich frage mich zB, weshalb Omnipage als OS X Programm nur richtig arbeitet, wenn ich als admin angemeldet bin. An solchen Dingen merkt man, dass dort dringend etwas getan werden müsste.
 
Ganz herzlichen Dank an alle. Ich habe sehr wertvolle Infos zum Kauf und für die Praxis bekommen und weiß jetzt, wo ich hin muss.

Guten Rutsch ins neue Jahr
Mit freundlichen Grüßen
Wosuli
 
Zurück
Oben Unten