Dokumenten-Management mit Paperless-NGX

Hi @bowman,

ich habs noch nicht ganz hinbekommen, aber es wird schon werden. Danke für den Tip.

Kennst Du eine einfache Möglichkeit, nachträglich Tags, Speicherorte etc. zuzusweisen? Im Moment gehe ich per SSH aufs NAS und dann mit einem docker-compose started dann das nachträgliche tagging.

Im Web-Interface geht es anscheinend nicht.

Gruß Reinhold
 
Ich kann Dir nur sagen wie ich die Speicherorte nachträglich ändere. Mit "document_renamer" und zwar im Terminal des Docker-Containers.
Bildschirmfoto 2023-04-07 um 19.20.39.png
 
Ich mache es im Moment so:

In einer SSH session aus dem Ordner, in dem das docker-compose.yml liegt z.B. für das nachträgliche Update der Lorrespondenten:
sudo docker-compose exec webserver document_retagger -c.

Muss mal probieren, ob das auch im Terminal des Containers direkt geht. Ist aber trotzdem umständlich. Ein Automatismus wäre schon schick.
 
Hallo,

bin gerade dabei auch bei mir paperless ngx einzurichten. Kurz zur Hardware, Synology DS220+ deswegen kleiner Mini PC mit Proxmox und darauf Paperless. Das läuft auch soweit schon. Da auf meiner Synology auch mein Mailserver läuft habe ich für paperless eine eigene Mail Adresse erstellt. Zu archivierende Mails werden dorthin weitergeleitet und automatisch eingelesen - auch das klappt nach ein paar Versuchen.
Wo ich noch hänge und Hilfe brauche ist die Ordnerstruktur - ich fürchte ich hab die noch nicht ganz verstanden.
- Ich möchte einen Ordner auf der Synology auf den ich Scannen kann und von Paperless automatisch eingelesen wird
- eigentlich möchte ich die originalen Dokumente lieber in Reinform bzw. in einer kurzen Ordnerstruktur auf der Synolog. Verwaltung und ocr Analyse gerne von Paperless.

Mein Kenntnisse was Linux und console betrifft ist absolut übersichtlich. Hab zur Installation viel eingegeben ohne genau zu wissen was da alles passiert. 😅

Ein paar gute Ideen wie ich das hinbekomme?
Vielen Dank schon mal
Andreas
 
Zuletzt bearbeitet:
Du müssest bei der Einrichtung des Conainers einen Ordner "scaninput" haben. dort kannst Du deine Scans/Dateien ablegen und paperless schaut periodisch nach und importiert.

In meiner docker_compose.yml ist er so verdrahtet:

volumes:
- ../data:/usr/src/paperless/data
- ../media:/usr/src/paperless/media
- ../export:/usr/src/paperless/export
- /volume1/scaninput:/usr/src/paperless/consume
 
- eigentlich möchte ich die originalen Dokumente lieber in Reinform bzw. in einer kurzen Ordnerstruktur auf der Synolog. Verwaltung und ocr Analyse gerne von Paperless.
Habs jetzt erst gelesen.
Du findest Deine importierten Datein in dem Ordner ../media/originals/..
Der darunter liegende Baum ist weitgehend anpassbar.
Entweder in der docker_compose.yml oder Du kannst dir mit bestimmten "Schlüsselworten" einen eigenen Speicherpfad (im Webinterface) bauen, der indivduell zugewiesen werden kann.
Bei mir sieht er beispielsweise so aus: {document_type}/{correspondent}/{created_year}/{title}
D.h. ich habe z.B. /Rechnungen/Firma_abcde/2023/meineRechnung.pdf

Deine Dokumente werden natürlic nicht geändert. Evtl. werden sie umbenannt. Auch das kann man konfigurieren. Alle anderen Metainformationen liegen dann in der Datenbank, die wiederum auf diese Datein zeigt.
Das bedeuted natürlich im Umkehrschluss: niemals diese Dateistruktur händisch anpassen (nur über paperless selbst). Du findest sonst nichts mehr.
 
Hallo und danke für die schnelle Antwort.
Weiß nicht ob bei der Installation alles so richtig war. Ordner habe folgende anlegen müssen - paperless-ngx (Systemdateien), consume, media, data und datebase. Allerding finde ich nur noch den paperless-ngx und consume. Wo die anderen hin sind???? Wie man da hin kommt?

1692105351408.png


ich glaube dein ScanInput ist mein Consume - aber wie bekomme ich da Dokumente rein???

Hab bitte Geduld mit mir
 

Anhänge

  • Installation.jpg
    Installation.jpg
    72,7 KB · Aufrufe: 51
Du brauchst auf deinem Server einen Ordner, den Du (z.B. per Finder) und/oder der Scanner per SMB oder FTP erreichen kannst. Bei mir läuft paperless-ngx auf einer Synology, dort habe ich zwei geteilte Ordner (Shares) eingerichtet: einen namens 'bowman' in dem (in Unterordnern) Paperless die Dokumente ablegt und einen names 'Scanner' in den der MuFu-Scanner per SMB direkt die Scans als PDF speichert. Dafür habe ich auf dem NAS einen User namens 'scanner' angelegt, dem ein eigenes Passwort gegeben und im MuFu-Scanner diese Anmeldedaten für den SMB-Upload hinterlegt. Dieser User hat nur Zugriff auf /volume1/Scanner/...
In der docker-compose.yml sieht das dann so aus:

Code:
volumes:
      # Hier die richtigen Pfade eintragen
      - /volume1/bowman/Dokumente/Paperless/Data:/usr/src/paperless/data
      - /volume1/bowman/Dokumente/Paperless/Dokumente:/usr/src/paperless/media
      - /volume1/bowman/Dokumente/Paperless/Export:/usr/src/paperless/export
      - /volume1/Scanner/Scanner-bowman:/usr/src/paperless/consume

Vermutlich gibt es auch noch einen eleganteren Weg, das in der .env zu konfigurieren. Das hätte den Vorteil, das man bei Updates nicht eventuelle Änderungen in der Struktur der docker-compose.yml mitführen muss.
Den extra User für den Scanner habe ich angelegt, damit bei einem Sicherheitsproblem des Scanners (der ja auch gelegentlich Netzwerkverbindungen ins Internet zu Brother aufbaut und prinzipiell im lokalen Netzwerk auch alles Mögliche anstellen kann) dieser keinen Vollzugriff auf die Dokumente meines Hauptusers 'bowman' hat...
 
Zuletzt bearbeitet:
Ok, das Anlegen von Benutzern und Shares aus Synology ist kein Problem.

Da Paperless auf einem eigenen Rechner ist unter Proxmox müssten die Laufwerksangaben ggf. so aussehen???

/192.168.x.x/volume1/bowman/Dokumente/Paperless/Data:/home/data

die anderen entsprechend..

korrekt???
1692109899306.png
 

Anhänge

  • 1692109178067.png
    1692109178067.png
    198 KB · Aufrufe: 57
...äh, eher nicht... ;)

Wenn das Verzeichnis, auf dem die PDFs des Scanners landen, auf der Synology liegt, musst Du dieses Verzeichnis in der Proxmox-VM mounten. Dazu muss die Synology dieses als NFS- oder SMB-Share im Netz erreichbar machen. Auf der Proxmox-VM muss dann ein NFS- oder SMB-Client laufen, der das Verzeichnis als Netzlaufwerk in das lokale Dateisystem mountet. Diesen Mountpunkt trägst Du dann in der docker-compose.yml in die Volumes-Pfadangabe ein.

Wenn Du das per SMB machst (was ich empfehlen würde): Installier dir auf der Proxmox-VM den CIFS-Client, leg ein Verzeichnis als Mountpoint fest, leg dir eine .smbcredentials-Datei in deinem dortigen Homeverzeichnis an, pack da den Nutzernamen / Passwort für den Zugriff auf die Freigabe rein und mach einen entsprechenden Eintrag in der /etc/fstab, als Beispiel:
Code:
//192.168.x.x/volume1/share/auf/dem/NAS         /home/andreas/paperless-ngx/consume  cifs   _netdev,credentials=/home/andreas/.smbcredentials   0 0

(mehr dazu: https://wiki.ubuntuusers.de/mount.cifs/)

Ich frag' mich nur, warum so umständlich? Es ist doch gar kein Problem, paperless-ngx per docker-compose auf der Synology laufen zu lassen - zumindest wenn man dort auch seine Dokumente lagern wollen würde. Die paperless-prozesse sind als Docker-Container (für die Meisten hinreichend) vom Host-System isoliert...

PS: Ich hatte auch meine "Proxmox-Phase". War nett, ich hab' eine Menge über ZFS und VLANs gelernt, aber irgendwann wird man alt und faul, es kommt einem das ganze Netzwerkgeraffel unnötig aufwändig vor und vor allem muss man seine Stromrechnung selbst bezahlen... ;-)
 
Zuletzt bearbeitet:
Ich frag' mich nur, warum so umständlich? Es ist doch gar kein Problem, paperless-ngx per docker-compose auf der Synology laufen zu lassen
Hatte ich mir auch gedacht. Wenn schon eine Synology vorhanden ist, kann sie ja auch die Arbeit machen.
Ich habe den Container auf der Synology (auch eine DS220+ mit 10GB) mit dem Sccript von Stefan eingerichtet. Das ging ratzfatz, ohne dass man tief in die Docker-Configuration einsteigen musste.
Wenn ich mal von außen zugreifen möchte (was wirklich selten vorkommt und bisher auch nur zum testen), nutze ich das VPN der Fritz!Box. Das funktioniert gut, ist keine Ausgeburt an Performance, aber ich muss keine Ports öffnen und solche Sachen.
Mit diesem Setup bin ich zufrieden. Läuft.

Gruß reinhold
 
Ja so langsam zweifle ich auch an meinem Plan - ob ich das überhaupt hin bekommen. Komme aus der Windows Welt - mit Linux und mounten hatte ich bisher so gut wie nix am Hut.
Ich dacht halt, dass die Synology mit MailServer, ioBroker und dann noch Paperless am Rande des Zusammenbruchs ist.
10GB Arbeitsspeicher habe ich auch. Was meint ihr - schafft die Synology das?

Achs so, Docker ist ja nicht mehr auf der Synology. Container Manager sieht aber ziemlich ähnlich aus. Macht das einen Unterschied???
 
Raider ist jetzt Twix😁 Container Mangager ist jetzt Docker auf der Synology.
Meine schafft das locker. es läuft allerdings kein Mailserver. Mein paperless holt die Mails (bzw. die Anhänge) direkt aus einem Mailkonto.
Großartige Kentnisse in Linux braucht es nicht. Du kennst Dich ja offensichtlich mit dem DSM aus. Dann dürfte das Setup des paperless-Containers kein größeres Hinderniss sein.

Ich habs mit dem Script gemacht (hat 15€ gekostet) und gut wars. Ein paar Fragen beantwortet und seitdem läuft es. Ab und zu kommt eine neue Version von paperless.
Dann mache ich es mit einem SSH Zugriff aus NAS. Dann brauchst ein bisschen Basiswissen auf der Kommandozeile. Aber das können wir gerne liefern.

Trau Dich. Kaputt geht nix.
 
Raiders kenne ich als Kind der 80ziger auch noch 😅 und so sah mir der Container Manager auch aus. Ich trau mich!

Wenn alles auf der NAS liegt hätte ich also keine Probleme mit Laufwerken und mounten. Schon mal gut.

Update einfach über apt-get update / upgrade oder wird es viel komplizierter???‘

Was bekommt man denn für die 15€? Lohnt sich das?

Fritz VPN nutze ich auch. Ist super

Dann ist es ja gut, dass ich meinen ioBroker auf der Nas nur gestoppt habe.

Vg Andreas
 
Update einfach über apt-get update / upgrade oder wird es viel komplizierter???‘
Nein, Du bist dann im Docker und das Update geht dann über Docker-Kommandos. Zumindest habe ih dafür noch dkeine GUI gefunden.
Du verbindest Dich via SSH von Deinem Rechner (Mac oder Windows oder Linux) auf Dein NAS:

z.B. SSH DeinUserNameAufDemNAS@DieIPdesNAS

Dann gehst Du zum Dockerverzeichnis:z:B. cd /volume1/docker/paperless.../config

Anschließend sind es drei Kommandos:

Code:
sudo docker-compose down  # fährt den Container runter

sudo docker-compose pull # zieht sich das eigentliche Update

sudo docker-compose up -d  # unterdrückt Meldungen beim Starten

Ist nenSache von fünf Minuten. Feddisch.
Was bekommt man denn für die 15€? Lohnt sich das?
Ja, weil Stefan ein praktisch fertiges Script bietet und Du anschließend eine lauffähige Installation hast und praktisch ichts nacharbeiten musst. Ich habe versucht, mich in docker einzuarbeiten (komme aus der IT), aber hab dann ob meines hohen Alters die Segel gestreckt. Das Script hats für mich gemacht.
Und auf der Seite hat er sehr brauchbare Videos und Artikel, die mir bei der Inbetriebnahme und ersten Versuchen sehr geholfen haben.

Gruß Reinhold
 
Das klingt danach, dass die 15€ gut investiert sind.

Ich werde mich heut Nachmittag mal an die Installation machen. Danke für die Hinweise. Ich berichte von Fortschritt

Vg Andreas
 
Hallo,

will meine Proxmox Idee doch noch nicht gleich begraben.

Habe auf meiner NAS ein Share "Proxmox" angelegt und darauf einen Ordner "Scan-Input". NFS Freigabe und in Proxmox ich glaube erfolgreich gemounted.
Zumindest kann ich jetzt darauf aus Proxmox Backups anlegen
1692214958910.png


in Paperless habe ich die docker-compose.yml wie folgt geändert

aus alt
- /home/andreas/paperless-ngx/consume:/usr/src/paperless/consume

neu
- /mnt/pve/Scan-Input:/usr/src/paperless/consume


natürlich klappt es noch nicht ;-)

seht ihr zufällig den Fehler???

vg Andreas
 
Zuletzt bearbeitet:
Habe auf meiner NAS ein Share "Proxmox" angelegt und darauf einen Ordner "Scan-Input". NFS Freigabe und in Proxmox ich glaube erfolgreich gemounted.
...was heisst "ich glaube"? Wenn Du auf dem NAS eine PDF-Datei in "Scan-Input" kopierst, siehst Du sie auf der Proxmox-VM in /mnt/pve/Scan-Input ? Hat der Account, unter dem Paperless läuft, Lese- und Schreibrechte in diesem Ordner? Das war mit ein Grund warum ich SMB statt NFS empfohlen habe, damit hat man nämlich nicht den Hazzle mit den UIDs bzw. Accunts auf den unterschiedlichen Systemen. Und was soll das mit dieser Backup-Funktion von Proxmox? Das heisst doch nur, dass Proxmox den Share vom NAS sieht. Nicht aber, das dieser auch in der VM gemountet ist in der paperless läuft. Läuft das überhaupt in einer VM oder in einem LXC-Container...?

Und nochmal: Wozu überhaupt Proxmox? Das bringt da eine Komplexität rein, die m.E. deine Kenntnisse derzeit überfordert. Ohne Dir zu nahe treten zu wollen: Einen solchen System-Unterbau willst Du im Produktivbetrieb managen und deine Daten anvertrauen?
 
Zuletzt bearbeitet:
..was heisst "ich glaube"?
Ich kann aus Proxmox heraus dort Backups anlegen und auch wiederherstellen. Von daher scheint die Verbindung hier zumindest zu bestehen.

Wenn Du auf dem NAS eine PDF-Datei in "Scan-Input" kopierst, siehst Du sie auf der Proxmox-VM in /mnt/pve/Scan-Input ?
Gute Frage. Ich hab unter Proxmox noch keinen File Explorer gefunden mit dem ich das sehen könnte

Hat der Account, unter dem Paperless läuft, Lese- und Schreibrechte in diesem Ordner?
Wie kann ich das testen ob die VM von Paperless Zugriff hast?

Nicht aber, das dieser auch in der VM gemountet ist in der paperless läuft.
Vermutlich liegt hier mein Problem, dass ich nicht weiß wie das geht

deine Kenntnisse derzeit überfordert.
Absolut richtig. Aber wer nicht wagt der nicht gewinnt.

vg Andreas
 
Ich habe paperless ebenfalls unter Proxmox am laufen und mittels Samba gebe ich den consume Ordner im Netz frei. Ich würde kein nfs machen denn das erhöht nur unnötig die Komplexität
 

Ähnliche Themen

Zurück
Oben Unten