tesseract Sprache hinzufügen (brew)

benjsing

Mitglied
Thread Starter
Dabei seit
13.04.2015
Beiträge
42
Reaktionspunkte
1
Hallo,

ich nutze ocrmypdf unter OSX, um aus Scans durchsuchbare PDF-Dateien zu erstellen. Die Installation des (afaik eigentlich für Linux gedachten) ocrmypdf hat relativ problemlos funktioniert. Eine Dependency ist tesseract, welches ebenfalls erstellt wurde. Leider bekomme ich mit `tesseract -l` angezeigt, dass nur die Sprache eng und osd installiert sein. Per `brew install tesseract --with-all-languages` (bzw. --all-languages) schaffe ich es nicht, die weiteren Sprachen zu installieren.

Ich brauche allerdings _unbedingt_ deu als Sprache, damit beim OCR Vorgang aus "Begründung" nicht "Begrfndung" wird (gerade eben so passiert).

Könnt Ihr mir sagen, wie ich entweder alle, oder zumindest das deutsche Sprachpaket nachträglich installieren kann?

Danke & LG
 
Leider bekomme ich mit `tesseract -l` angezeigt, dass nur die Sprache eng und osd installiert sein.

"tesseract -l" zeigt nicht die installierten Sprachen an, die Option "-l" setzt die Sprache, die bei der Texterkennung genutzt werden soll. Da du aber kein Dokument übergibst, sollten einfach nur Hinweise zu Verwendung ausgegeben werden. Die installierten Sprachen kannst du dir mit "tesseract --list-langs" anzeigen lassen.
 
@Haskelltier ja, mein Fehler... Ich meinte auch, dass `tesseract --list-langs` mir eben nur eng und osd anzeigt. Mit `tesseract -l`kann ich auf jeden Fall deutsch nicht als Sprache festlegen ...
 
Also bei mir baut homebrew tesseract mit allen Sprachen, wenn die Option "--with-all-languages" genutzt wird.
 
Zurück
Oben Unten