OCR-Dokumente in Netzlaufwerk (NAS) nach bestimmten Texten durchsuchen

RudiSH

Registriert
Thread Starter
Dabei seit
20.11.2022
Beiträge
4
Punkte Reaktionen
0
Hi,
seit langem bin ich auf der Suche nach einer Lösung, meine mit OCRmyPDF angepassten Dokumente auf meinen NAS zu durchsuchen.
Bei Windows geht es mit Boardmitteln, bei Mac augenscheinlich nicht.

Beispiel:
Ich habe eine PDF auf meinen NAS (Synology) abgelegt. Dies wird automatisch von dem installierten Plugin OCRmyPDF über nachts OCR-mäßig überarbeitet und ich danach lesbar.
Wenn ich diese Daten nun auf auf meinen Mac ablege, dann kann ich einen gewünschten Text (z.B. Kfz-Steuer) wunderbar mit der Spolight-Suche finden. Dies sucht aber nicht in Netzlaufwerken, wäre bei der Menge an Dateien auch etwas krass.
Wenn ich im Finder in der Suche nach dem gewünschten Text suche, dann wird die entsprechende Datei ebenfalls gefunden.

Gibt es eine Möglichkeit mit einem Programm oder einer Funktion, wenn ich in dem entsprechenden Ordner bin, nach einer Textpassage zu suchen?

Meine Ablage ist komplett auf OCR ausgelegt und seit dem Umstieg von PC auf Mac habe ich da echt ein Problem.

Danke und Gruß
Rudi
 

RIN67630

Aktives Mitglied
Dabei seit
13.09.2021
Beiträge
3.421
Punkte Reaktionen
1.413
Wenn ich diese Daten nun auf auf meinen Mac ablege, dann kann ich einen gewünschten Text (z.B. Kfz-Steuer) wunderbar mit der Spolight-Suche finden. Dies sucht aber nicht in Netzlaufwerken, wäre bei der Menge an Dateien auch etwas krass.
Dafür sucht macOS in NTFS-Laufwerke immer wieder von neuem für die Katz, weil es den Indexergebnis dort nicht hinschreiben kann.
Das beste OS der Welt... :rolleyes:
 

RudiSH

Registriert
Thread Starter
Dabei seit
20.11.2022
Beiträge
4
Punkte Reaktionen
0
Dankeschön, MacKaz. 👍🏼
Das schau ich dann gleich mal an, aktuell lädt die Website nicht.
 

DerSt3fan

Mitglied
Dabei seit
14.04.2022
Beiträge
169
Punkte Reaktionen
43
Gibt es eine OCR-App für die Syno die PDFs automatisch zieht?
 

bowman

Aktives Mitglied
Dabei seit
08.10.2003
Beiträge
3.029
Punkte Reaktionen
1.796
…die Syno kann doch selbständig Dateien indizieren:
https://kb.synology.com/de-de/DSM/help/SynoFinder/universalsearch_index?version=7
Die Suche erfolgt dann entweder in der Weboberfläche oder mit der Suchfunktion des Finders in den gemounteten Netzlaufwerken, obwohl letzteres irgendwie nervig ist.
Ich hatte von dem ganzen Mist den Kanal voll und hab mir das Dokumentenmanagementsystem Paperless-NGX auf der Syno installiert. Das macht das OCR, klassifiziert die Dokumente selbsttändig und Volltextsuche geht selbstverständlich auch.
 
Zuletzt bearbeitet:

bowman

Aktives Mitglied
Dabei seit
08.10.2003
Beiträge
3.029
Punkte Reaktionen
1.796
Und für den Einstieg ist das hier vielleicht ganz nützlich:

https://mariushosting.com/how-to-install-paperless-on-your-synology-nas/

Ich habe es nicht am Start, aber ich denke @bowman wird es evtl. ähnlich gelöst haben.
...die verlinkte Anleitung ist veraltet. Stand der Dinge ist die Anleitung zum aktuelleren Entwicklungszweig Paperless-NGX, dort kommt statt normalem docker das komfortablere docker-compose zum Einsatz: https://mariushosting.com/how-to-install-paperless-ngx-on-your-synology-nas/
Ich würde allerdings empfehlen, auf Portainer zu verzichten falls man sich ein bisschen im Terminal und mit docker-compose auskennt.
 
Zuletzt bearbeitet:
Oben