NIE WIEDER Papierkram suchen! đŸ˜± Paperless-NGX in der Praxis

@guezli

ich möchte das gerne genauso (mit Docker) umsetzen, und könnte da UnterstĂŒtzung brauchen. LĂ€uft das bei Dir mit einem Debian oder Ubuntu Paket?

Und bist Du nach einer Anleitung vorgegangen? Ich hab jetzt schon einige vergebliche Versuche gestartet und wieder abgebrochen.

Viele GrĂŒĂŸe
Harald

Moin,

das spielt keine Rolle, auch Ubuntu ist im Grunde genommen ein Debian :slight_smile:

Das sollte man immer machen, denn die sollten ja am ehesten wissen, wie man seine Software installiert :slight_smile:

Was genau hast Du gemacht, bzw. wo klemmt es?

Wem Docker nativ zu umstÀndlich ist, der sollte sich erst Portainer oder Komodo installieren, damit hat man dann eine Web-UI in der man alles machen kann.

VG
Bernd

Hallo Bernd,

ich hatte mich zum Schluss an dieser Anleitung orientiert, da sie tatsÀchlich auch Portainer mit installiert.

LXC eingerichtet (Unprivileged), dann Update, Upgrade, Docker und Docker-Compose installiert, Portainer installiert.

Aber die Webseite von Portainer mit dem Port 8000 hatte keinen Inhalt. Die Meldung muss ich heute Mittag nochmal raussuchen.

Viele GrĂŒĂŸe
Harald

Moin,

sehe ich das korrekt, dass Du Proxmox nutzt?

Das sind nur Fragen, damit ich das besser verstehe,

  • Wenn man Proxmox nutzt, warum installiert man paperless-ngx nicht als LXC?
  • Warum, wenn Proxmox in Benutzung, dann nochmals ein Linux und darin ein Docker, dann nutzt man zwei Virtualisierungen?
    • und wenn das unbedingt der Wunsch ist, warum installiert man sich das nicht auch mittels der Helferskripte?

Bei mir ist das aber der Port 9000, der 8000er ist eigentlich fĂŒr die interne Kommunikation :thinking:

VG
Bernd

ich hatte bereits mehrere Versuche mit dem Helperscript. Das war nÀmlich auch meine erste Wahl. Das bleibt aber hÀngen, irgendwo bei Ghostscript.

Daher hatte ich einen alternativen Weg gesucht.

Moin,

bitte genau beschreiben was, wie, wo?
Mit irgendwo bei, kann ich Dir nicht helfen, Support geht nur, wenn Du spezifisch, genau bist :slight_smile:

VG
Bernd

Danke vorab fĂŒr die angebotene UnterstĂŒtzung. Ich hab heute Nachmittag frei. Dann starte ich das Helper Skript nochmals. Und dann bekommst Du die notwendigen Infos. :slight_smile:

Hallo Bernd,

ich hatte die Installation immer im Verbose Mode gestartet, Unmengen Warnings und Outputmeldungen bekommen, und der Meinung gewesen er hĂ€ngt jetzt fest. Ich hatte aber einfach nur nicht genĂŒgend Geduld aufgebracht und jedes Mal abgebrochen.

Heute Nachmittag habe ich ihn einfach mal machen lassen.

Was soll ich sagen, er hat die Installation zu Ende gebracht, die Webseite von Paperless lÀsst sich aufrufen. Die Anmeldeinformationen habe ich auch heraus bekommen.

Ich werde jetzt mal noch Samba installieren, damit ich von außen auch Dateien auf das consume Verzeichnis schieben kann.

Sorry und vielen Dank. Dein Nachfragen hat es mich zum GlĂŒck nochmals versuchen lassen. :slight_smile:

Viele GrĂŒĂŸe
Harald

Blöde Frage, ich liebe ja Digitalisierung und habe mal vor 2 Jahren meine ganzen Dokumente angefangen zu scannen und zu ordnen damit ich so wie die Idee hier ist alles digital und leichter zugÀnglich ohne Chaos habe.

Was sind den die Vorteile es hiermit drĂŒber laufen zu lassen als wenn ich meine Post einscannen und eben hĂ€ndisch in Ordnern ablege?

Der einzige Vorteil den ich sehe wÀre die volltextsuche dann musste man aber die Dokumente richtig scannen oder gescannt haben oder macht da im Hintergrund eine ki das Bild Dokument zu Text?

man kann in Paperless mit Tags arbeiten, beim importieren lĂ€uft eine OCR Texterkennung drĂŒber, man kann E-Mail Konten tracken und bspw. per E-Mail eingehende Rechnungen automatisch importieren, usw.

ich hatte da mal zufÀllig diese Seite gefunden. Da wird es eigentlich ganz gut erklÀrt:

Nachtrag:
Noch ein Denkfehler, ein unprivilegierter LXC kann keine Freigaben. Ich werde wohl Backup und Restore des LXC anwenden um dann die Freigabe erstellen zu können.

:crayon:by HarryP: ZusammenfĂŒhrung Doppelpost (bei Änderungen oder hinzufĂŒgen von Inhalten bitte die „Bearbeitungsfunktion“ anstatt „Antworten“ zu nutzen)

Dagegen spricht gar nichts solange Du und andere die Übersicht behalten und in vertretbarer Zeit das richtige Dokument findet.

Moin,

eben, genau das ist der Unterschied :slight_smile:
An Deiner Methode ist nichts Verwerfliches, aber Du machst alles von Hand, in einem DMS = Dokumenten Management System, also ein ComputergestĂŒtztes System, oft mit einer Datenbank, die das Suchen von Informationen unterstĂŒtzt.

In paperless-ngx hast Du workflows, die Dir die Arbeit abnehmen, erleichtern, z. B. Du scannst direkt in einen Ordner und paperless-ngx sortiert das Dokument anhand von wiederkehrenden Merkmalen fĂŒr Dich ein, das kann so weit gehen, das die Dokumente auch in Unterordner abgelegt werden, gleichzeitig werden die Dokumente (PDFs) die noch nicht maschinenlesbar sind in solche umgewandelt, danach geht eine OCR ĂŒber das Dokument und lernt den Inhalt in einer Datenbank, was Dir spĂ€ter bei der Suche nach bestimmten Dokumenten helfen kann.
Zudem hast Du verschiedene Zuordnungsebenen, wie z. B. Korrespondent, Art des Dokuments, Tags, Aufgabenfilter, wie z. B. Verfallsdatum, damit kann man dann Dokumente automatisch löschen oder sich zur Wiedervorlage markieren.

Du kannst z. B. auch verschiedene Ansichten einstellen, z. B. Steuerunterlagen 2025, dann werden alle Dokumente, die Du mit Steuerunterlagen 2025, automatisch in dieser Ansicht aufgelistet.

Aber all das steht auch auf der wirklich hervorragenden Seite von paperless-ngx
https://docs.paperless-ngx.com/
Da gibt es sogar eine Demo, mit der Du spielen kannst.

WeitefĂŒhrender Lesestoff wurde im Thread schon genann, ich erspare mir das nochmalige Posten :wink:

VG
Bernd

@dp20eic

jetzt könnte ich evtl. nochmals Deine Hilfe brauchen. Paperless mag nÀmlich keine eml-Dateien verarbeiten. Lt. Fehlermeldung

Unsupported mime type message/rfc822

sieht es so aus als ob Tika/Gotenberg nicht lÀuft.

In der paperless.conf ist Tika enabled:

# Tika settings

PAPERLESS_TIKA_ENABLED=true
PAPERLESS_TIKA_ENDPOINT=http://localhost:9998
PAPERLESS_TIKA_GOTENBERG_ENDPOINT=http://localhost:3000 

Ich kann nicht sagen, ob Tika und Gotenberg auch installiert wurden. Kann ich das irgendwie nachprĂŒfen?

Viele GrĂŒĂŸe
Harald

Moin,

bei der Installation von paperless-ngx wird auch nur das installiert.
Es gibt zwei Möglichkeiten, man installiert das als Docker Container, Tika und gotenberg, oder man sucht sich Repositorien, und bindet diese in den LXC mit ein und installiert beides dann darĂŒber.

FĂŒr Docker gibt es einige Anleitungen, fĂŒr Debian Bare Metall Installation habe ich auf die schnell nichts gefunden.

Es gibt aber auch ein Helferskript, das einen Tika LXC erstellt.

VG
Bernd

1 „GefĂ€llt mir“

Hallo Bernd,
ich hab den Lösungsansatz mit Tika und gotenberg als Docker im Bare Metall LXC gewÀhlt. Es funktioniert auch mit Office2PDF. Nur das Importieren von E-Mails (eml) klappt noch nicht.

Unter nachstehendem Link ist das ganz gut beschrieben

Viele GrĂŒĂŸe
Harald

Moin,

wie machst Du das?
Speicherst Du die Mail vorher aus Deinem bevorzugten E-Mail-Programm, also legst Du eine Datei davon auf Deinem Rechner ab?

Es gibt die Möglichkeit, E-Mails direkt aus paperless-ngx zu verarbeiten, dazu kannst Du dann sagen, verarbeite nur die AnhĂ€nge, oder die ganze E-Mail, ĂŒber diesen weg verarbeite ich meine E-Mails, die ich von Versicherungen usw. bekomme.

Du könntest auch, bei den meisten Providern möglich, einen speziellen E-MailempfÀnger anlegen, den paperless-ngx nutzt um alles, was an diese Adresse geschickt wird, automatisch zu verarbeitet, dann musst Du von Deinem privaten E-Mail-Account nur alles an diese Adresse weiterleiten.

VG
Bernd

2 „GefĂ€llt mir“

Guten Morgen,

ah genau, das hab ich gesucht. Hab das jetzt als E-Mail Regel eingerichtet. Hat funktioniert, vielen Dank.

Wenn es mehr wird, denke ich darĂŒber nach ein eigenes Postfach dafĂŒr anzulegen.

Viele GrĂŒĂŸe
Harald

Hi Folks,

hier mal meine Gedanken dazu.

Bei mir lÀuft Paperless als Docker unter unraid, funktioniert alles, habe gespiegelte NVME SSDs und als Langzeit gespiegelte Harddisks.

Das consume wird entweder vom Scanner direkt beladen oder ĂŒber die Email-Abfrage von Paperless. Habe mir dazu eine eigene Mailadresse eingerichtet, an die ich die jeweiligen Emails weiterleite, der Anhang wir herausgefiltert, dann die Email gelöscht, damit das Postfach nicht ĂŒberlĂ€uft.

LĂ€uft einfach gut.

jm2c

Franky

Hallo zusammen,

jemand eine Idee, wie ich meine Daten aus dem Paperlass-Addon in Homeassistant mit dem document-exporter exportieren kann? HAbe bereits per commandline im container via

docker exec -it CONTAINER-NAME sh

document_exporter ../export

einen Export erstellt, aber wie bekomme ich diesen nun aus dem Container? Kann den ja schlecht mit einem wput oder Àhnlichem wo hinladen. :wink:

Hintergrund: Möchte PaperlessNGX kĂŒnftig in Proxmox laufen lassen und meine Daten hierfĂŒr aus dem Home-Assistant-Addon exportieren.