Wie OCR-Sprache in Paperless-ngx ändern?

uhlhorn

uhlhorn

Aktives Mitglied
Thread Starter
Dabei seit
24.05.2005
Beiträge
2.474
Reaktionspunkte
129
Moin,
ich habe Paperless-ngx auf Debian installiert. Für die Installation habe ich das Installationsscript von der Paperless-ngx-Seite verwendet. Der Debian-Container läuft auf Proxmox.

Im Ordner /home/paperless/paperless-ngx/ habe ich ein File namens docker-compose.env mit folgendem Inhalt:
Code:
PAPERLESS_URL=https://paperless.local
PAPERLESS_TIME_ZONE=Europe/Berlin
PAPERLESS_OCR_LANGUAGE=deu
PAPERLESS_SECRET_KEY=6mQITU84vh7WtYjxC0AjGYurE7wWJ1TU84vh7WtYjxC0AjGYu34uktrE7wWJ1H2z
(Der Secret-Key ist hier natürlich nicht der echte Key, sondern ein Fantasie-Key, den ich mit einem Passwortgenerator erstellt habe.)

Wenn ich das richtig verstehe, muss ich die Zeile PAPERLESS_OCR_LANGUAGE=deu auf PAPERLESS_OCR_LANGUAGE=deu+eng ändern, richtig?

Meine Frage ist nun: Werden diese Einstellungen automatisch übernommen? Oder muss ich den Container neu erstellen? Oder reicht es den Proxmox-Container neu zu starten?

Falls ich den Container neu erstellen muss, mit welchem Befehl mache ich das? Reicht ein docker-compose build? Behalte ich dabei meine Daten?

Gruß
Gerhard

PS: Debian und Paperless-ngx sind die jetzt aktuellen Versionen. Nur Proxmox ist noch die letzte 7er-Version, also 7.4-17.
 
Auf Deiner verlinkten Seite unter „OCR settings“ wird sogar darauf hingewiesen, dass man deu+eng verwenden soll:
Dabei kann es sich um eine Kombination mehrerer Sprachen handeln, z. B. deu+eng. In diesem Fall wird Tesseract die Sprache verwenden, die am besten passt. Denken Sie daran, dass Tesseract viel mehr CPU-Zeit benötigt, wenn mehrere Sprachen aktiviert sind.
(Maschinell übersetzt)

Woher hast Du die Information, dass man kein + verwenden darf? Ich würde das gerne nachvollziehen.
 
Und ja, Du musst den Container nach Änderungen an der .env neu erstellen. Daten bleiben erhalten.

zum neu erstellen
docker-compose down
- Stops containers and removes containers, networks, volumes, and images created by up.
dann

docker-compose pull
um sich Aktualisierungen zu ziehen (z.B. neueste Paperless Version

und dann noch ein
docker-compose up -d

siehe auch https://github.com/paperless-ngx/paperless-ngx/discussions/3246
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: uhlhorn
@elChupete: Oh, das ist gut zu wissen! Vielen Dank.

Ich habe die docker-compose.env geändert und den Proxmox-Container neu gestartet. Heute habe ich mein erstes englisches Dokument eingelesen und er hat den Text fehlerfrei erkannt. Auch die englische Schreibweise des Datums, z.B. 2023-11-07 wird jetzt einwandfrei erkannt. Das funktionierte vorher nämlich nicht.

Es sieht so aus, als wenn ein Neustart des Debian-Containers in Proxmox schon ausreicht. Wie auch immer … das mit dem Update ist auch wichtig zu wissen. Das wäre wahrscheinlich meine nächste Frage gewesen.
 
Zurück
Oben Unten