OCR-Dokumente in Netzlaufwerk (NAS) nach bestimmten Texten durchsuchen

R

RudiSH

Mitglied
Thread Starter
Dabei seit
20.11.2022
Beiträge
4
Reaktionspunkte
0
Hi,
seit langem bin ich auf der Suche nach einer Lösung, meine mit OCRmyPDF angepassten Dokumente auf meinen NAS zu durchsuchen.
Bei Windows geht es mit Boardmitteln, bei Mac augenscheinlich nicht.

Beispiel:
Ich habe eine PDF auf meinen NAS (Synology) abgelegt. Dies wird automatisch von dem installierten Plugin OCRmyPDF über nachts OCR-mäßig überarbeitet und ich danach lesbar.
Wenn ich diese Daten nun auf auf meinen Mac ablege, dann kann ich einen gewünschten Text (z.B. Kfz-Steuer) wunderbar mit der Spolight-Suche finden. Dies sucht aber nicht in Netzlaufwerken, wäre bei der Menge an Dateien auch etwas krass.
Wenn ich im Finder in der Suche nach dem gewünschten Text suche, dann wird die entsprechende Datei ebenfalls gefunden.

Gibt es eine Möglichkeit mit einem Programm oder einer Funktion, wenn ich in dem entsprechenden Ordner bin, nach einer Textpassage zu suchen?

Meine Ablage ist komplett auf OCR ausgelegt und seit dem Umstieg von PC auf Mac habe ich da echt ein Problem.

Danke und Gruß
Rudi
 
Wenn ich diese Daten nun auf auf meinen Mac ablege, dann kann ich einen gewünschten Text (z.B. Kfz-Steuer) wunderbar mit der Spolight-Suche finden. Dies sucht aber nicht in Netzlaufwerken, wäre bei der Menge an Dateien auch etwas krass.
Dafür sucht macOS in NTFS-Laufwerke immer wieder von neuem für die Katz, weil es den Indexergebnis dort nicht hinschreiben kann.
Das beste OS der Welt... :rolleyes:
 
Dankeschön, MacKaz. 👍🏼
Das schau ich dann gleich mal an, aktuell lädt die Website nicht.
 
Gibt es eine OCR-App für die Syno die PDFs automatisch zieht?
 
…die Syno kann doch selbständig Dateien indizieren:
https://kb.synology.com/de-de/DSM/help/SynoFinder/universalsearch_index?version=7
Die Suche erfolgt dann entweder in der Weboberfläche oder mit der Suchfunktion des Finders in den gemounteten Netzlaufwerken, obwohl letzteres irgendwie nervig ist.
Ich hatte von dem ganzen Mist den Kanal voll und hab mir das Dokumentenmanagementsystem Paperless-NGX auf der Syno installiert. Das macht das OCR, klassifiziert die Dokumente selbsttändig und Volltextsuche geht selbstverständlich auch.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: ruerueka, DerSt3fan und dg2rbf
Und für den Einstieg ist das hier vielleicht ganz nützlich:

https://mariushosting.com/how-to-install-paperless-on-your-synology-nas/

Ich habe es nicht am Start, aber ich denke @bowman wird es evtl. ähnlich gelöst haben.
...die verlinkte Anleitung ist veraltet. Stand der Dinge ist die Anleitung zum aktuelleren Entwicklungszweig Paperless-NGX, dort kommt statt normalem docker das komfortablere docker-compose zum Einsatz: https://mariushosting.com/how-to-install-paperless-ngx-on-your-synology-nas/
Ich würde allerdings empfehlen, auf Portainer zu verzichten falls man sich ein bisschen im Terminal und mit docker-compose auskennt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: redfootthefence
Zurück
Oben Unten