HA(VM) geht einfach aus

Hallo, ich habe seit ein paar Tagen das Problem, dass mein HA einfach aus geht.

Ich betreibe HA als VM auf einem Proxmox. Sowohl in Proxmox noch im HA-Log steht irgendetwas, warum HA ausfällt.

Ich muss die VM einfach neu starten und alles ist wieder in Ordnung.

Hat jemand einen Tipp, wie ich dem ganzen auf die Schliche kommen kann, warum HA einfach aus geht?

Alle anderen LXC und VM laufen wie gewohnt weiter auf Proxmox.

Moin

Das kann ich mir eigentlich fast gar nicht vorstellen.

Eine VM kann nicht einfach “aus gehen”, ohne das es dazu im Proxmox Log irgendwelche Einträge gibt. D.h. Du solltest wirklich im Proxmox Log noch einmal nachschauen ob da zu der HA VM nicht doch irgendwelche Einträge auftauchen. Also z.B. so etwas in der Art:

Nov 16 01:00:20 pve qm[2650501]: shutdown VM 108:

Außerdem solltest Du - z.B. per File Editor - mal einen Blick in die HA Log Dateien selber werfen.

VG Jim

Wahrscheinlich lag es daran, dass ich als DNS Server Adguard genommen habe. Ich habe einfach jetzt ein paar öffentliche DNS Server hinzugefügt und schaue mal, ob das was bringt…..

Benutze ich schon ewig ohne Probleme. Ich hatte das eben auch, war ein Problem mit der BackUp Funktion von HA.

War daher auch immer zur gleichen Zeit, dass mein HA dann “aus” war.

Dann solltest Du hier aber auch mal schreiben was Du unter “einfach aus geht” genau verstehst. :slightly_smiling_face: Ich verstehe darunter das die HA VM gar nicht mehr läuft und das hat nichts mit irgendwelchen DNS Servern zu tun.

VG Jim

Die Backupfunktion von NabuCasa hatte ich auch schon mal in Verdacht…. Ich werde die auch mal wieder ausschalten.

Ich würde mein Problem gerne genauer beschreiben, wenn ich wüsste, was es genauer ist.

Ich stelle immer nur ab und zu (alle ein zwei Tage zu unterschiedlichen Zeiten) fest, dass die VM von HA aus ist in Proxmox und nirgends ein Hinweis darauf ist, weshalb….

Daher suche ich einen Weg, das Problem besser einschränken zu können.

Gut dann ist zumindest geklärt was Du mit “aus geht” meinst. :slightly_smiling_face: Wie gesagt kann das nichts mit einem DNS Server zu tun haben, denn selbst wenn HA gar keine Verbindung zu irgendeinem DNS Server hätte, gebe es zwar Einschränkungen unter HA und HA würde dann einige Dinge “anmeckern”, aber das würde nicht dafür sorgen das die HA VM unter Proxmox aus ist und nicht mehr läuft.

Dazu hatte ich Dir ja geschrieben was Du machen könntest/solltest.

VG Jim

Ich habe Copilot mal meinen log gegeb und ihn auswerten lassen, hier das Ergebins:

Deine Home Assistant VM 100 ist am 17.11. gegen 09:08 Uhr ausgefallen, weil der Prozess vom OOM-Killer (Out Of Memory Killer) des Linux-Kernels beendet wurde. Das bedeutet, dass auf deinem Proxmox-Host der Arbeitsspeicher knapp wurde und das System entschieden hat, die VM 100 (Home Assistant) zu beenden, um Speicher freizugeben.

Hier die relevanten Log-Zeilen aus deinem Logfile:

Nov 17 09:08:24 pve kernel: Out of memory: Killed process 8998 (kvm) total-vm:10791484kB, anon-rss:7990536kB, ...
Nov 17 09:08:25 pve systemd[1]: 100.scope: A process of this unit has been killed by the OOM killer.
Nov 17 09:08:25 pve systemd[1]: 100.scope: Failed with result 'oom-kill'.

Zusammengefasst:

  • Die VM 100 (Home Assistant) wurde durch den OOM-Killer beendet, weil nicht mehr genug RAM zur Verfügung stand.

  • Kurz danach wurde die VM als “failed” markiert.

Was kannst du tun?

  • Prüfe, wie viel RAM deinem Proxmox-Host insgesamt zur Verfügung steht und wie viel den VMs zugewiesen ist.

  • Überlege, ob du der Home Assistant VM mehr RAM zuweisen kannst.

  • Prüfe, ob andere Prozesse oder VMs ungewöhnlich viel Speicher verbrauchen.

  • Optional: Swap aktivieren, um kurzfristig Speicherengpässe abzufedern (ist aber meist nur eine Notlösung).

Mein Proxmox Host (ein NUC i5) kann nicht mehr als 16GB und die sind drin. mal sehen, was ich noch so machen kann.

Du hast der Home Assistant VM aber nicht mehr als 8GB RAM zugewiesen, oder? 4GB reichen auch schon völlig aus.

Gruß Osorkon

Moin,

diese Logs gibt es nicht mehr, ist mit dem November Update von HA anders gelöst, es wird jetzt alles in das journal von systemd geschrieben

➜  ~ ls -la homeassistant/home-assistant.log*
-rw-r--r--    1 root     root      49453387 Nov  5 15:39 homeassistant/home-assistant.log.1
-rw-r--r--    1 root     root             0 Nov 17 12:14 homeassistant/home-assistant.log.fault
-rw-r--r--    1 root     root     209857680 Nov  6 05:56 homeassistant/home-assistant.log.old
➜  ~ 

Siehe Datum!
Hier mal der Teil vom Changelog

As of this release, we’ve stopped writing logs to the configuration folder. You can still view and download all logs from the Home Assistant settings page, just like before. We’ve adapted that page to read the logs from the OS directly instead.

Ich nutze auch AdGuard in meinen PVEs, ohne Problem und warum sollte sich eine HAOS VM daran stören, aber alles andere nicht :thinking:

VG
Bernd

Ich hatte es auf 8gb, habe es jetzt auf 4GB begrenzt und eine Swap eingerichtet.

Moin,

kannst du dich noch erinnern, was da gerade in der VM an intensiven Sachen lief, dass dort der Speicher knapp wurde?

Denn es scheint ja dann ein generelles Problem zu sein und durch deine Änderung wird das dann auch nicht besser.

Was läuft alles auf dem Proxmox als LXC und VM? Am besten gleich mit der korrekten Konfiguration zeigen!

Hast du das System über provisioniert, also die verfügbaren Ressourcen zu großzügig verteilt, z. B. deine 16 GB deutlich überschritten?

  • PVE braucht ~ 1 GB Memory
  • HAOS VM ~ 4 GB, je nachdem was noch alles als Add-on und Integrationen läuft
  • Zigbe2MQTT ~ 0,5 - 1 GB
  • MQTT ~ 1 GB

Wenn du aber ein Prozess hast, der innerhalb der VM Memory frisst, dann machst Du das nur noch schlimmer, wenn du das auf 4 GB reduzierst, selbst wenn du ein 4 GB Swap einrichtest, dann läuft dir dieser auch wieder voll.

Es gibt in der HAOS VM z. B. den Backupprozess, der sehr viel Speicher braucht, da erst alles im Memory gesammelt wird, bevor es dann in das Backup geschrieben wird, wenn dann Add-on wie z. B. influxDB mit einer größeren Datenbank dabei ist, kann das schon mal eng werden.

Oder du hast lokale, also in der HAOS VM, Backups liegen, die auch wieder mit eingepackt werden.

VG
Bernd

Stimmt Du hast Recht. :+1: Mein Fehler. :woozy_face: Vielleicht hätte ich selber mal einen Blick in meine Logs werfen sollen, dann wäre mir das anhand des letzten Datums darin (2025-11-17 15:40:09.532) sicherlich auch selber aufgefallen. :rofl:

VG Jim

Moin,

wieso, das stimmt ja noch mit dem heutigen Datum und wohl auch der Uhrzeit überein.
Auch im Bild von oben passt das bei Dir noch, bei mir ist aber im homeassistant bzw. im config Ordner eben kein aktuelles Log mehr vorhanden.

Da muss etwas anderes sein, das bei Dir noch das home-assistant.log vorhanden ist
grafik

VG
Bernd

1 „Gefällt mir“

Stimmt - heute ist wohl irgendwie nicht mein Tag und ich glaube ich sollte mir jetzt mal ganz viel Kaffee einflößen. Vielleicht hilft das ja. :laughing: Ich nutze noch Core 2025.10. :slightly_smiling_face:

VG Jim

1 „Gefällt mir“

Nein, da es immer irgendwann passiert.

Ich habe nichts priorisiert. Ich denke, es hat mit dem Backup Prozess von HA zu tun. Ich muss es mal beobachten.

Oder hast du ne Idee, wie ich dies irgendwie bewiesen bekomme, dass es am Backup liegt?

Bei mir war es, weil ich die Verschlüsselung für die lokale Sicherung ausgeschaltet hatte. MitbVerschlüsselung war das Problem nicht aufgetreten.

Hat sich aber seit 2025.11.2 erledigt.

Moin,

einfach mal ein manuelles Vollbackup anstoßen und schauen was passiert.
Sollte es wirklich am Backup liegen, dann umsteigen und Proxmox Backups machen und die HA Backups ausschalten, ich mache nur Proxmox Backups, aber alles extern, zum einen auf ein Proxmox Backup Server (PBS) der bei mir steht und in ein PBS in der Cloud zu Tuxis nach Holland, weil ich damals noch ein kostenlosen 150 GB Schnapper bekommen habe, reicht für die wichtigsten LXC und die VM.

VG
Bernd

Ich will nur mal anmerken, dass der OOM-Kill auf dem Proxmox pasiert ist, nicht innerhalb der HA VM. Das ist ein kleiner Unterschied und wichtig bei der Betrachtung.

Der Kernel des Proxmox hat wg. Speicherengpässen den OOM-Kill ausgepackt. Solange die HA VM nicht mehr RAM zugewiesen bekommen hat als im Proxmox überhaupt verfügbar ist, sollte es erstmal egal sein. Kommt aber darauf an, was sonst noch auf dem Proxmox mit welcher Provisionierung und Speichernutzung läuft. Aber das wurde ja schon gefragt…

Ich habe jeztzt in Zusammenarbeit mit Copilot eine Swap Datei erstellt. Mal sehen, ob ich so wieder in den Griff bekommen:

root@pve:~# swapon --show
NAME TYPE SIZE USED PRIO
/dev/zd48 partition 8G 0B -2
/dev/zram0 partition 2.3G 10.8M 100
root@pve:~#