Paperless: Speichergröße und Ordner: Ein letztes Hinterfragen des Backup Ansatzes

Moin

Ich habe noch nicht angefangen, Papierordner einzuscannen aber schiebe bereits in den Jahren gesammelte Dateien nach Paperless … nur eine Ablage, nur eine Suche. Bisher sind ca. 600 Dokumente enthalten und ich werfe einen Blick auf den Speicherverbrauch.

  • “media”: Ordner, hier legt Paperless die Dokumente ab
  • “export”: Hier lasse ich nächtlich per Aufgabenplaner einen Dokumenten export machen

“Unter” dem Media Ordner gibt es

  • “originals”: Hier legt Paperless die unberührten Originale ab
  • “archive”: Hier werden die archivierten OCR verarbeiteten PDF’s abgelegt

Soweit so gut. Die Zahlen sehen alle noch vertäglich aus aber mein Blick geht in die Zukunft.

Habe ich hier eine unnötige Doppelung, die irgendwann das Backup und das Backup des Backups aufblähen wird?

Ich schaue allerdings mehr auf den “export” Ordner.

  • Auf die Idee kam ich als ich mich im Backup/Restore Verhalten übte, siehe auch Paperless ngx - Synology - Backup/Restore ist nicht trivial oder geht es auch anders?.
  • In Kürze: Per Aufgabenplaner und Bash Script stoße ich momentan noch täglich einen DB Dump und Dokumenten Export an und sichere über HyperBackup. :latest habe ich aus fast allen Dockern herausgenommen, damit ein Restore der Container auch wirklich funktioniert.
  • Ziel ist es, auf jeden Fall den Verlust der Daten zu vermeiden. Noch werde ich nervös bei dem Gedanken, ich habe alles nach Paperless geschaufelt und Originale entsorgt und dann sind aus irgendeinem Grund die Daten weg.

Die Frage, die ich mir stelle:
Wenn im Ordner “originals” sowieso alle Originale liegen - bei Verwendung von Speicherpfaden sogar nach denen sortiert - brauche ich dann überhaupt den nächtlichen/wöchentlichen Export?

Oder brauche ich den nur, wenn ich vorhabe, Paperless zu verlassen?

Habt Ihr eine Meinung dazu?

Danke im Voraus!

Moin,

der Exportordner ist nur für den Fall gedacht, dass Du mittels der Exportfunktion von paperless-ngx einen Export brauchst, weil Du ein neues paperless-ngx aufgesetzt hast oder aus einem anderen Grund, die Daten aus einem Docker in ein LXC, VM, brauchst.
Warum Du Dir da täglich ein Export machst, verstehe ich nicht :thinking:

Dann gibt es bei der Exportfunktion, die Möglichkeit das ganze zu ZIPen, wird dann kleiner, nach dem Export, sollte man das Archive File, das erstellt wurde auch nicht im Exportordner liegen lassen, sondern woanders hinschieben.

Das ist aber meine ganz persönliche Meinung, kann jeder anders sehen :wink:

Ich habe ~ 1600 Dokumente, sind ~ 1,5 GB, ich sichere mein LX Container einmal täglich, mir reicht das.

Hast Du denn so viele PDFs, die schon durchsuchbar sind, ist Dein Scanner dazu in der Lage, solch ein PDF zu erzeugen, sodass paperless-ngx da nichts mehr machen muss, aber versuch macht kluch :slight_smile:

Alles wieder mal nur meine Meinung, jeder so wie ihm beliebt :slight_smile:

VG
Bernd

1 „Gefällt mir“

Meine Meinung bzw wie ich es handhabe:

Wenn es dir nur um die Dokumente geht, brauchst du den Export nicht. Denn beim Export werden zusätzlich zu den Dokumenten noch die ganzen Tags, Speicherpfade, Einstellungen usw mit gespeichert.
Eben für den Fall, man muss Paperless komplett restoren oder woanders, auf einem anderen Gerät oder System wieder so installieren, wie man es hatte.
Wenn du aber immer bei deinem selben System bleibst, sowieso deine Docker / Container immer backupst, so daß sie dadurch komplett wieder hergestellt werden können, dann ist der Export wirklich nur ein nice to have.

Ich nutze Paperless auf Unraid, mache da täglich ein Backup der Docker und kann durch dieses Backup dann immer Paperless komplett wieder herstellen, mit allem was dazu gehört.
Zusätzlich mache ich aber trotzdem 1x wöchentlich einen Export. Aber behalte immer nur den aktuellen. Mache also beim Export keine Versionierung oder behalte mehrere. Ich habe so viel Speicherplatz, da fällt das nicht ins Gewicht.

1 „Gefällt mir“

Wie immer Bernd danke, Du rockst das Paperless Thema.
Ich lese auch Deine Kommentare bei Paperless Fragen von anderen.

Aus Anfänger Nichtwissen und Angst vor Datenverlust.
Aber wie Du siehst, hinterfrage ich ja noch.

Hatte auch damit probiert und auch über Bash Script ein Datum anzuhängen. Ja kann man machen.

In meinem Backup Script leere ich vor jedem Export den Export Ordner, so daß nur ein Export enthalten ist. Die Versionierung (rollierendes Backup) inklusive Verschlüsselung für monatliche Cloud-Sicherung überlasse ich HyperBackup.

Mit dem Scanner habe ich kaum gearbeitet bisher, ich schiebe momentan nur frühere Archivierungen vom PC System nach Paperless. Stichproben ergaben, einige gab es. Der Scanner würde mich wundern, wenn der das kann aber dafür ist auch Paperless da.

Dieser Parameter ist momentan für mich nur Nebensache, evt. für später. Ich finde ihn nur interessant, wenn man wirklich in diesem Bereich die Größe beeinflussen will. Warum extra PDF speichern wenn das Original bereits durchsuchbar ist, ist der Gedanke.

Moin,

ja, aber immer mit Augenmaß, denn man kann auch alles verschlimmbessern, oder sich so tief in den Kaninchenbau hinab begeben, dass man das ganze aus dem Auge verliert :wink:
Mach ein vernünftiges Backup der Dockerumgebung, bzw. der Volumes, in denen die Daten des paperless-ngx Docker Containers liegen, dann noch bas 3-2-1-0 Backup Paradigma beachten und Du bist sicher.
Ein Export in paperless-ngx plus Backup, plus Hyperbackup, bei einem Fehler welches Backup würdest Du zurückspielen?

Das ist super, auch die Fragen, die Du stellst, machen Spaß sich damit zu befassen, denn ich stelle oft bei mir fest, dass ich glaube alles zu wissen, wenn ich dann aber in mich gehe, dann merke ich, dass ich auch nicht jede Frage wirklich verstanden habe und bin gezwungen noch einmal darüber nachzudenken.

In der Schule kam oft,

Ach der schon wieder mit einer Frage!

Aber im Grunde war jeder, der nicht gefragt hat happy, dass sie gestellt wurde, weil man es auch nicht verstanden hat, ging mir rückblickend so :slight_smile:

Wie ich ja schon geschrieben habe, ist mir zu Aufwendig, für mich stellt sich immer die Frage, welches Backup würde ich wieder einspielen?
Ich mache nur ein Proxmox LXC Backup zu Tuxis in die Niederlande, wenn ich, ist mir einmal passiert, etwas zerschieße, dann hole ich mir das zurück, fertig, ist in 5 Minuten erledigt.

Schau dir die Specs an, vielleicht geht das ja. Es hängt auch etwas von der verwendeten Software ab, die kann so etwas meist auch.

Wie gesagt, das große Ganze nicht aus den Augen verlieren, bis ich in die Region mit gescannten Dokumenten vorstoße, dass das von der Größe nicht mehr händelbar ist, vergeht schon so einige Zeit, sodass Dokumente gelöscht werden können, da sie nicht mehr relevant sind.

Aber weiter so, Du bereicherst das Thema.

VG
Bernd