gImageReader & Tresseract - Rechtschreibprüfung

G

Grettir

Aktives Mitglied
Thread Starter
Dabei seit
02.04.2011
Beiträge
3.525
Reaktionspunkte
784
Ich habe kürzlich Tesseract und gImageReader als Möglichkeit zur Texterkennung von Frakturschrift entdeckt. Das Ergebnis ist gar nicht mal schlecht, wenn man bedenkt, dass es sich um Freeware handelt und in Rechnung stellt, was OCR-Lösungen für Frakturschrift normalerweise kosten. Jedenfalls kommt man so erheblich schneller und mit weniger Mühe zu einem brauchbaren Text als durch Abschreiben (von der Möglichkeit, ihn mit Dragon Dictate zu diktieren, ganz zu schweigen, da ist man ja immer schneller, wenn man es gleich selbst schreibt).

Zwei Punkte finde ich bedauerlich: Das Training scheint sehr kompliziert zu sein, jedenfalls verstehe ich nur, dass ich überhaupt nichts begreife, wenn ich die Anleitung lese. Aber es geht auch ohne.

Seltsamer ist, dass die Rechtschtreibprüfung nicht funktioniert. Ich habe die entsprechenden Wörtberbücher heruntergeladen und in das Verzeichnis kopiert. Sie werden auch erkannt, und ich kann »Deutsch« als Sprache auswählen. Allerdings werden alle Wörter als falsch markiert, als wäre das Wörterbuch vollkommen leer, was bei 13 MB doch nicht sein kann.

Kennst sich hier jemand damit aus und kann mir sagen, was ich eventuell noch probieren könnte?
 
Zurück
Oben Unten