tesseract-OCR installieren und nutzen? Tutorial gesucht

florianus

Neues Mitglied
Thread Starter
Mitglied seit
14.11.2011
Beiträge
26
Hallo liebe Expertinnen und Experten,

für ein kleines Projekt mit historischen Zeitungen in Frakturdruck (wichtig) suche ich eine für Dummies geschriebene Anleitung, wie ich auf einem High Sierra System tesseract-OCR korrekt installiere und dann auch nutzen kann. Ich verstehe leider nicht allzu viel von den Eingaben im Terminal.

Ich hatte bereits versucht, es via Homebrew herunterzuladen und zu installieren, aber nun wirft es immer nur "-bash: brew: command not found" aus und macht nichts weiter.

Wer weiß Rat und könnte mir helfen? Vielen Dank im Voraus.
 

oneOeight

Aktives Mitglied
Mitglied seit
23.11.2004
Beiträge
55.176
um brew zu nutzen, musst du erst mal homebrew installieren.
falls du es schon installiert hast, ist brew wohl nicht im PATH.
entweder das korrigieren oder brew mit vollem pfad aufrufen.
 
  • Gefällt mir
Reaktionen: dg2rbf

florianus

Neues Mitglied
Thread Starter
Mitglied seit
14.11.2011
Beiträge
26
Okay, das hat geklappt - wie füge ich nun das Paket für deu-frak also Frakturerkennung zu tesseract hinzu?
 

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
Code:
brew install tesseract-lang
 
  • Gefällt mir
Reaktionen: dg2rbf

florianus

Neues Mitglied
Thread Starter
Mitglied seit
14.11.2011
Beiträge
26
Danke, inzwischen konnte ich aus einem pdf mit imagemagick eine tiff-Datei machen. Aber tesseract drüberlaufen lassen klappt irgendwie nicht? Wie geht das im Idealfall?
 

Schiffversenker

Aktives Mitglied
Mitglied seit
25.06.2012
Beiträge
11.192
Was hast du denn gemacht und was ist passiert oder nicht passiert? Fehlermeldung?
 

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
Bash:
# auto language
tesseract infile.tif outfile-basename pdf

# angabe der zu verwendenden sprachen deu und Fraktur (in tessdata/script)
tesseract -l deu+script/Fraktur infile.tif outfile-basename pdf
 

florianus

Neues Mitglied
Thread Starter
Mitglied seit
14.11.2011
Beiträge
26
Bash:
# auto language
tesseract infile.tif outfile-basename pdf

# angabe der zu verwendenden sprachen deu und Fraktur (in tessdata/script)
tesseract -l deu+script/Fraktur infile.tif outfile-basename pdf
Da sagt es mir "-bash: tesseract command not found" ? Was mache ich falsch? Noch eine Frage: Wie sollte denn meine Ordnerstruktur für tesseract aussehen bzw. wo sollte ich die traineddata Dateien hinspeichern?
 
Zuletzt bearbeitet:

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
1. wenn brew installiert wird, sagt es dir i.d.R. dass dein PATH ergänzt wurde oder du das manuell tun musst.
ausloggen, einloggen hilft meist. ansonsten kannst du den PATH für die brew-binaries ergänzen.

2. wenn du #4 ausgeführt hast, sind die traineddatas schon da, wo sie sein sollen. :p
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf

Schiffversenker

Aktives Mitglied
Mitglied seit
25.06.2012
Beiträge
11.192
ansonsten kannst du den PATH für die brew-binaries ergänzen.
Ich schätze, daß du das dem TE genauer erläutern solltest.

Das Terminal bzw. korrewkrt gesagt die Shell schaut, wenn man ein Kommando eingibt, in bestimmten, per $PATH vorgegebenen Pfaden, wo das Programm oder Miniprogramm liegt, das ausgeführt werden soll.
Die mitgelieferten UNIX-Befehle liegen in Ordnern, die der Shell bekannt sind, zusätzlich hinzugefügte liegen, wenn sie über Fink, MacPorts, HomeBrew o.ä. installiert wurden, aber in anderen Verzeichnissen, zum Beispiel /opt oder /usr. Die Pfade dorthin muß man der Shell bekanntmachen.
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
ausloggen, einloggen auch?
schwer wird einem nichts gemacht. brew schreibt schon hin, was zu tun ist.
 

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
mach einfach einen neustart und gib dann "tesseract -h" ein.
 
  • Gefällt mir
Reaktionen: dg2rbf

dg2rbf

Aktives Mitglied
Mitglied seit
08.05.2010
Beiträge
7.019
Hi,
da stimmt der PATH/Pfad zu tesseract nicht, du musst das ändern.

Franz
 
  • Gefällt mir
Reaktionen: florianus

Schiffversenker

Aktives Mitglied
Mitglied seit
25.06.2012
Beiträge
11.192
Dann findet die Shell den Pfad zum Programm nicht.
Entweder musst du den eintragen - wie das geht müsste auf den Seiten von homebrew beschrieben sein - oder du musst im Terminal den kompletten Pfad zu tesseract eingeben oder in den Ordner wechseln, wo das Programm liegt.
 
  • Gefällt mir
Reaktionen: florianus und dg2rbf

florianus

Neues Mitglied
Thread Starter
Mitglied seit
14.11.2011
Beiträge
26
Es sagt mir nun, wo es liegt, aber wie ändere ich den Pfad, damit die commands passen?
Das bekomme ich bei $ brew list tesseract
/usr/local/Cellar/tesseract/4.1.1/bin/tesseract
/usr/local/Cellar/tesseract/4.1.1/include/tesseract/ (19 files)
/usr/local/Cellar/tesseract/4.1.1/lib/libtesseract.4.dylib
/usr/local/Cellar/tesseract/4.1.1/lib/pkgconfig/tesseract.pc
/usr/local/Cellar/tesseract/4.1.1/lib/ (2 other files)
/usr/local/Cellar/tesseract/4.1.1/share/tessdata/ (35 files)
 

Olivetti

Aktives Mitglied
Mitglied seit
09.12.2005
Beiträge
11.697
Bash:
echo "export PATH="'$(brew --prefix)/bin:$PATH' >> ~/.$(basename $SHELL)rc
und nochmal wie in #14.
 
Oben