tesseract-OCR installieren und nutzen? Tutorial gesucht

F

florianus

Mitglied
Thread Starter
Dabei seit
14.11.2011
Beiträge
26
Reaktionspunkte
0
Hallo liebe Expertinnen und Experten,

für ein kleines Projekt mit historischen Zeitungen in Frakturdruck (wichtig) suche ich eine für Dummies geschriebene Anleitung, wie ich auf einem High Sierra System tesseract-OCR korrekt installiere und dann auch nutzen kann. Ich verstehe leider nicht allzu viel von den Eingaben im Terminal.

Ich hatte bereits versucht, es via Homebrew herunterzuladen und zu installieren, aber nun wirft es immer nur "-bash: brew: command not found" aus und macht nichts weiter.

Wer weiß Rat und könnte mir helfen? Vielen Dank im Voraus.
 
um brew zu nutzen, musst du erst mal homebrew installieren.
falls du es schon installiert hast, ist brew wohl nicht im PATH.
entweder das korrigieren oder brew mit vollem pfad aufrufen.
 
  • Gefällt mir
Reaktionen: dg2rbf
Okay, das hat geklappt - wie füge ich nun das Paket für deu-frak also Frakturerkennung zu tesseract hinzu?
 
Code:
brew install tesseract-lang
 
  • Gefällt mir
Reaktionen: dg2rbf
Danke, inzwischen konnte ich aus einem pdf mit imagemagick eine tiff-Datei machen. Aber tesseract drüberlaufen lassen klappt irgendwie nicht? Wie geht das im Idealfall?
 
Was hast du denn gemacht und was ist passiert oder nicht passiert? Fehlermeldung?
 
Bash:
# auto language
tesseract infile.tif outfile-basename pdf

# angabe der zu verwendenden sprachen deu und Fraktur (in tessdata/script)
tesseract -l deu+script/Fraktur infile.tif outfile-basename pdf
 
Bash:
# auto language
tesseract infile.tif outfile-basename pdf

# angabe der zu verwendenden sprachen deu und Fraktur (in tessdata/script)
tesseract -l deu+script/Fraktur infile.tif outfile-basename pdf
Da sagt es mir "-bash: tesseract command not found" ? Was mache ich falsch? Noch eine Frage: Wie sollte denn meine Ordnerstruktur für tesseract aussehen bzw. wo sollte ich die traineddata Dateien hinspeichern?
 
Zuletzt bearbeitet:
1. wenn brew installiert wird, sagt es dir i.d.R. dass dein PATH ergänzt wurde oder du das manuell tun musst.
ausloggen, einloggen hilft meist. ansonsten kannst du den PATH für die brew-binaries ergänzen.

2. wenn du #4 ausgeführt hast, sind die traineddatas schon da, wo sie sein sollen. :p
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf
ansonsten kannst du den PATH für die brew-binaries ergänzen.
Ich schätze, daß du das dem TE genauer erläutern solltest.

Das Terminal bzw. korrewkrt gesagt die Shell schaut, wenn man ein Kommando eingibt, in bestimmten, per $PATH vorgegebenen Pfaden, wo das Programm oder Miniprogramm liegt, das ausgeführt werden soll.
Die mitgelieferten UNIX-Befehle liegen in Ordnern, die der Shell bekannt sind, zusätzlich hinzugefügte liegen, wenn sie über Fink, MacPorts, HomeBrew o.ä. installiert wurden, aber in anderen Verzeichnissen, zum Beispiel /opt oder /usr. Die Pfade dorthin muß man der Shell bekanntmachen.
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf
Ich schätze, daß du das dem TE genauer erläutern solltest.
Richtig - und #4 hatte ich gemacht. Nur warum gibt es die Fehlermeldung? Kann ich hier zur Klärung beitragen? Ich hätte nicht gedacht, dass es für Anfänger so schwer ist.
 
ausloggen, einloggen auch?
schwer wird einem nichts gemacht. brew schreibt schon hin, was zu tun ist.
 
ausloggen, einloggen auch?
schwer wird einem nichts gemacht. brew schreibt schon hin, was zu tun ist.
Sorry, ich bin ein völliger Newbie. Wie macht man log-out und log-in? Wo? Bei tesseract? Brew?
 
mach einfach einen neustart und gib dann "tesseract -h" ein.
 
  • Gefällt mir
Reaktionen: dg2rbf
Hi,
da stimmt der PATH/Pfad zu tesseract nicht, du musst das ändern.

Franz
 
  • Gefällt mir
Reaktionen: florianus
Dann findet die Shell den Pfad zum Programm nicht.
Entweder musst du den eintragen - wie das geht müsste auf den Seiten von homebrew beschrieben sein - oder du musst im Terminal den kompletten Pfad zu tesseract eingeben oder in den Ordner wechseln, wo das Programm liegt.
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf
Es sagt mir nun, wo es liegt, aber wie ändere ich den Pfad, damit die commands passen?
Das bekomme ich bei $ brew list tesseract
/usr/local/Cellar/tesseract/4.1.1/bin/tesseract
/usr/local/Cellar/tesseract/4.1.1/include/tesseract/ (19 files)
/usr/local/Cellar/tesseract/4.1.1/lib/libtesseract.4.dylib
/usr/local/Cellar/tesseract/4.1.1/lib/pkgconfig/tesseract.pc
/usr/local/Cellar/tesseract/4.1.1/lib/ (2 other files)
/usr/local/Cellar/tesseract/4.1.1/share/tessdata/ (35 files)
 
Bash:
echo "export PATH="'$(brew --prefix)/bin:$PATH' >> ~/.$(basename $SHELL)rc
und nochmal wie in #14.
 
Bash:
echo "export PATH="'$(brew --prefix)/bin:$PATH' >> ~/.$(basename $SHELL)rc
und nochmal wie in #14.
Scheinbar bin ich zu sehr Anfänger, aber es passiert nix, wenn ich das eingebe. :unsure:
 
Zurück
Oben Unten