HA installation in Proxmox funktioniert nicht mehr

Hallo Gemeinde

Heute Nacht hat mein HomeAssistant, vor etwa vier Wochen installiert auf Proxmox mittels Helper-Script, den Geist aufgegeben.
Er war heute morgen nicht mehr über die Web-Oberfläche erreichbar. Auch nach mehreren Neustarts des LXC-Containers nicht.
Auf der Proxmox-Konsole habe ich versucht, mich in HA einzuloggen. Das ging aber irgendwie nicht. HaOS ist hier schon ein wenig speziell.
Davon hab ich leider keine Ahnung.
Ich habe jetzt ein zwei Wochen altes PVE-Backup und das HA-Samba-Backup von gestern Nacht “gerestored”. Jetzt geht es wieder.
An den im HA aufgzeichneten Graphen hab ich gesehen, dass der “Todeskampf” bereits um ca. 19:30 angefangen hat.
Denn ab diesem Zeitpunkt haben die Datenaufzeichnungen sukzessive aufgehört.
Um 23:30 Uhr ist das Samba-Backup noch komplett durchgelaufen.Und ab 23:33 Uhr wurde gar nichts mehr aufgezeichnet.
An Speicherplatzmangel dürfte es nicht gelegen sein. Ein df -h in der Konsole des “restoreden” Systems zeigt überall maximal 32%Use. Als 68% Free Space.
Mehr angaben kann ich leider nicht machen.

Hat jemand eine Ahnung, was hier passiert sein könnte?

PS: Die anderen VM´s auf dem Proxmox-Server funktionieren einwandfrei.

Du schreibst mal LXC, mal von VM… Wie ist Homeassistant denn jetzt bei dir installiert?

Hallo

Bitte um Vergebung für die Ungenaugkeit.
Es ist eine VM.

Moin,

Mit den wenigen Informationen kann man das nur schlecht analysieren, aber ich habe da so ein zwei Sachen, die Du checken kannst.

  1. Dass die VM nur 4 GB Memory hat, ist meiner Meinung nach knapp, hängt natürlich auch von den installierten Integrationen und Add-ons ab, ich würde schon 8 GB als Untergrenze betrachten
  2. wenn Du mal den Zeitraum der Beobachtung in Proxmox von Stunde auf Woche stellst, dann könnte man schauen, ob sich das Memory unnatürlich verhalten hat


3. schau auch mal in die Logs von Proxmox, ob es da etwaige Meldungen bezüglich der VM gibt.

  1. dann würde ich in den Logs von HA noch schauen, ob es dort Auffälligkeiten gibt.

VG
Bernd

Hallo Bernd

Zu 1: Ich denke Arbeitsspeicher und Plattenplatz sollten ausreichen. Auf Raspi 4 lief das ein halber Jahr problemlos gelaufen.

Zu 2: Da hab ich leider die defekte VM zu früh gelöscht.
Zu 3: Die PVE-Loge´s geben in dem besagten Zeitraum nichts her.

Jul 05 17:17:01 pve CRON[299039]: pam_unix(cron:session): session closed for user root
Jul 05 18:17:01 pve CRON[311757]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 18:17:01 pve CRON[311758]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 18:17:01 pve CRON[311757]: pam_unix(cron:session): session closed for user root
Jul 05 19:00:56 pve chronyd[793]: Selected source 23.88.7.139 (2.debian.pool.ntp.org)
Jul 05 19:17:01 pve CRON[324504]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 19:17:01 pve CRON[324506]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 19:17:01 pve CRON[324504]: pam_unix(cron:session): session closed for user root
Jul 05 20:17:01 pve CRON[337247]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 20:17:01 pve CRON[337248]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 20:17:01 pve CRON[337247]: pam_unix(cron:session): session closed for user root
Jul 05 21:17:01 pve CRON[349972]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 21:17:01 pve CRON[349973]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 21:17:01 pve CRON[349972]: pam_unix(cron:session): session closed for user root
Jul 05 21:57:56 pve smartd[656]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 112 to 111
Jul 05 22:17:01 pve CRON[362617]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 22:17:01 pve CRON[362618]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 22:17:01 pve CRON[362617]: pam_unix(cron:session): session closed for user root
Jul 05 23:08:36 pve systemd[1]: Starting apt-daily.service - Daily apt download activities...
Jul 05 23:08:36 pve systemd[1]: apt-daily.service: Deactivated successfully.
Jul 05 23:08:36 pve systemd[1]: Finished apt-daily.service - Daily apt download activities.
Jul 05 23:17:01 pve CRON[375598]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Jul 05 23:17:01 pve CRON[375599]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jul 05 23:17:01 pve CRON[375598]: pam_unix(cron:session): session closed for user root
Jul 06 00:00:05 pve systemd[1]: Starting dpkg-db-backup.service - Daily dpkg database backup service...
Jul 06 00:00:05 pve systemd[1]: Starting logrotate.service - Rotate log files...
Jul 06 00:00:05 pve systemd[1]: dpkg-db-backup.service: Deactivated successfully.
Jul 06 00:00:05 pve systemd[1]: Finished dpkg-db-backup.service - Daily dpkg database backup service.
Jul 06 00:00:05 pve systemd[1]: Reloading pveproxy.service - PVE API Proxy Server...

Zu 4: Wie komme ich an die Log´s ran, wenn die Web-Oberfläche nicht mehr erreichbar ist? Über die PVE-Konsole kann ich das nicht. Ich weiß nicht, wie das beim diesem HA OS funktioniert.

Moin,

Nur mal so aus der Geschichte der IT, IBM ging auch mal davon aus, dass ~ 100 PC weltweit reichen würden und auch, dass 8 KB an Hauptspeicher ausreicht :wink:
Jedes Update, das kommt, bringt neue Funktionen mit sich, die Speicher brauchen, oder es braucht zusätzliche Libs, die Platz auf der Platte brauchen und wenn sie geladen werden, auch im Memory, also ist die Aussage von Dir nur bedingt zu gebrauchen, mit jedem Update, knabberst Du mehr am Memory, wird der knapp, Lagert der Kernel selten gebrauchten Speicher aus, wenn das aber gerade der Teil war, den JA brauchte, dann knallt es und noch eine Plattitüde, Speicher ist durch nichts zu ersetzen, als durch mehr Speicher :slight_smile:

Mal ein Bilderbuch :slight_smile:


Wenn Du da bist einfach mal enter drücken

Dann einmal host tippen und abfeuern
grafik

Dann das machen z. B.

Hiermit siehst Du alle Identifier, die man bei -t angeben kann
grafik

Ich würde Dir dazu raten, die Kommunikation mittels ssh zu aktivieren und einzurichten, da gibt es auch ein Video von @simon42 zu

Dann kannst Du auf das System zugreifen ohne, dass Du die WEB-GUI brauchst, der Zugang verhält sich eher wie das klassische Remote terminal.

VG
Bernd

Hallo

Der Arbeitsspeicher scheint tatsächlich sehr knapp zu sein.



Und hier noch die RAM-Auslastung des Host-Systems:

Da werd ich wohl ein wenig Hardware investieren müssen.
Weißt Du denn, ob ich der HA-VM in Proxmox einfach den virtuellen Arbeitsspeicher erhöhen kann/darf?

ssh-Fernzugang hab ich jetzt auch eingerichtet.
Und Arbeitsspeicher ist auch bestellt.
Schadet ja nichts.

4GB RAM für Home Assistant OS ist mehr als ausreichend.
Egal ob Bare Metal oder als VM in Proxmox.

Ich könnte wahrscheinlich de kompletten RAM von 96GB Home Assistant zuordnen und Proxmox würde irgendwann behaupten, dass auch diese voll in Anspruch genommen wird.

Ob 12 GB RAM oder 4 GB RAM ich merke hier überhaupt kein Unterschied. Egal ob es um Performance oder Stabilität geht. Home Assistant Läuft seit eh un je absolut stabil und zuverlässig.

Die dazugehörige RAM Auslastung in % in Home Assistant.

Gruß
Osorkon

Danke für Deine Einschätzung.
Mein Raspi 4 hat ja auch einwandfrei funktioniert.
Nichts desto trotz hat Bernd schon recht. Hubraum ist nur durch noch mehr Hubraum zu ersetzen :wink:

Nur bezweifle ich, dass mehr Hubraum Dein Eingangs beschriebenes Problem lösen wird. :wink:

Gruß
Osorkon

Ehrlich gesagt, ich auch nicht.
Aber ich kann mit mehr RAM diese Möglichkeit weitestgehend ausschließen.

Statt auf den RAM-Verbrauch der HA VM unter Proxmox zu schielen :slightly_smiling_face: wäre es eigentlich interessanter was HA selber an RAM-Verbrauch anzeigt und wie sich dieser in letzter Zeit verhalten hat.

HA_Sysinfo

Sofern Du nicht Unmengen an Integrationen und Add-ons nutzt sind 4 GB RAM für HA vollkommen ausreichend. D.h. Deine jetzige RAM-Verteilung (4 GB für Proxmox Host und 4 GB für HA VM) sollten m.M.n. nicht die Ursache für Dein Problem sein.

Was Deine Frage betrifft: Ja den der HA VM zugewiesenen Abeitsspeicher kannst Du jederzeit über die Proxmox Einstellung vergößern.

VG Jim

Hallo Jim

Die Systeminfo-Integration hab ich vorhin gerade installiert.
Da muss ich jetzt einfach mal beobachten, wie sich das mit der Zeit entwickelt.
Und viele Integrationen hab ich nicht wirklich. Automatisierunstechnisch lebe ich eher noch in der Steinzeit. Hat auch seinen Charme…

Mal abgesehen von der Android TV Remote Integration und der Midea, laufen die anderen Dinge hier auch bei mir und noch wesentlich mehr. :slightly_smiling_face: Den HA RAM Verbrauch bei mir kannst Du ja in meinem Screenshot sehen.

D.h. die paar Sachen können niemals Deine 4 GB RAM für die HA VM auslasten. Somit muss m.M.n. Dein Problem auch wo ganz anders liegen - wo auch immer. Außer es gebe ggf. gerade einen Bug mit der von Dir genutzten Proxmox Version. Bei der von Dir genutzen Proxmox Version 8.2.4 - die ich hier selber nutze - ist mir aber aktuell nichts in der Richtung bekannt. Wobei ich noch die Proxmox Kernel-Version 6.8.8-1 nutze und somit nicht die aktuellste.

BTW: Lt. Deinen Screenshots nutzt Du noch HA OS 12.3. Aktuell wäre eigentlich 12.4.

Ich würde mich an Deiner Stelle mal anhand der HA Protokolle (Core, Host usw.) auf die Suche nach einer möglichen Ursache begeben. Wie gesagt glaube ich nicht das es an Proxmox und auch nicht an den “nur” 4 GB RAM liegt.

VG Jim

Moin,

meine Aussage von oben, sollte ja nur einmal verdeutlichen, dass mit jeder Erweiterung, Updates, die da in Zukunft noch kommen, eine neue Python Version, funktional erweiterte Integrationen, mehr Speicher brauen und somit die Aussage, das für immer und ewig 4 GB ausreichen, halt eine falsche Aussage, ist.
Natürlich reichen 4 GB aus, ich hab ja auch nur gemeint, dass wenn, z. B. ein Backupjob, bei einem Update, halt versucht das Backup im Hauptspeicher zu erstellen, bevor es auf Platte geschrieben wird, und ja nach Erfolg wird der Speicher auch über die Zeit wieder freigegeben.

Ich habe halt aus der beruflichen Vergangenheit halt schon öfter mitbekommen, dass sich Systeme seltsam verhalten, wenn Speichermangel auftritt.

Ich würde auch nicht auf den Speicherverbrauch schauen, sondern darauf, ob es Anzeichen von Auslagerung gibt oder ob Prozesse aufgrund von Speichermangel gekillt werden.

@hanshiasl
Dann kannst Du Dir auch das Add-on Glances installieren und damit beobachten, was Dein System so macht!
grafik

VG
Bernd

P.S.: Ich werde dann hier auch keine weitere RAM-Diskussion mehr weiterführen, das ist eine Entscheidung, die muss jeder für sich entscheiden.

Auf 12.4 habe ich vorhin aktualisiert.

Was könnte wohl ein Debian-basiertes Betriebssystem (davon gehe ich aus) während des laufenden Betriebes derart aus dem Tritt bringen, das es nicht mehr funktioniert? Kein Stromausfall, keine Überschwemmung, nichts.
Diese Linuxe mit ext4 gelten doch allgemein als unkaputtbar.
Mein Arch- Linux Notebook läuft seit 2017.

Hallo

Ist schon in Ordnung. Bei einer Fehlersuche ist jeder Denkanstoß erwünscht!

Was im Prinzip ja auch richtig ist, dass heißt aber nicht das man nicht auch ein Linux BS “in die Knie zwingen” kann. :laughing: Wenn ich bei mir hier die letzten Jahre HA Nutzung mal Revue passieren lassen dann ist es natürlich auch immer mal wieder vorgekommen das irgendwelche Updates auch zu eher seltsamen Problemen mit HA geführt haben. Sowohl was ein Bare Metal Installation von HA betrifft, als auch per VM unter Proxmox. Wenn man Proxmox nutzt kommt halt noch eine zusätzliche Ebene hinzu die Probleme bereiten kann, was in der Vergangenheit bei der Kombination Proxmox + HA VM auch schon vorgekommen ist. Somit kann man natürlich auch bei HA, welches auf einem Linux BS basiert, nie ausschließen das es in die Knie, oder sogar ganz den Bach herunter geht.

Hinzu kommt natürlich das sich üblicherweise jede HA Installation von einer anderen HA Installation unterscheidet und man somit bei einem eher exotischen Problem bei sich vor Ort bei seiner HA Installation auf die Suche gehen muss.
Oder anders gesagt: Gebe es gerade ein konkretes Problem mit Proxmox Version X, in der Kombination mit der HA Version Y, auf einer Plattform Z, das viele User betrifft, dann wäre das vermutlich bereits bekannt und man würde Infos dazu finden.

Das ist halt wie bei allen anderen HA Updates. Egal ob OS, Core, Integration, oder Add-on. Bei den meisten Usern laufen diese problemlos und manche User haben irgendwelche Probleme.

Wie schon gesagt hilft da nur bei seiner HA Installation auf die Suche nach dem Problem zu gehen und da sind die HA Protokolle die erste Anlaufstellt. Ich bin mir fast sicher das auch in Deinen HA Protokollen irgendwelche Warnung und/oder Fehler auftauchen :slightly_smiling_face: und mit viel Glück lassen sich daraus ggf. schon Rückschlüsse auf das Problem ziehen. Falls nicht muss man halt an anderen Stellen suchen und z.B. auch mal einen Blick in das Proxmox PVE System-Log werfen ob dort ggf. irgendwelche Problem-Meldungen, z.B. zu der verwendeten Host-Hardware, auftauchen.

BTW: Du hattest ja auch geschrieben:

Um was für “andere” VMs geht es denn da? Wenn Dein Proxmox Host nur 8 GB RAM hat bliebe für andere, parallel zu der HA VM laufende VM, eigentlich kaum noch RAM über.

VG Jim

Hallo

Ich hab da noch Motioneye mit 1 GB, AdGuard mit 1 GB (das hab ich jetzt gestoppt, da nur zum Testen), PiHole mit 2 GB und ein Ubuntu Server als NAS mit 2 GB Arbeitsspeicher.
Sind in der Summe mehr als 8 GB. Und PVE selber braucht auch noch was zum Leben.
Insofern schadet mehr AS in keiner Weise.
Wer weiß, womöglich passiert dann nichts mehr.
Natürlich hast Du Recht. Es gibt immer etwas, was man nicht voraussagen kann.

Du verwirrst mich gerade ein wenig. :slightly_smiling_face: Du hast doch oben einen free - m Screenshot gepostet bei dem man sehen kann das der Proxmox Host 8 GB RAM hat. Wie soll das was Du jetzt gepostet hast denn funktionieren:

4 GB HA VM
1 GB Motioneye
1 GB ADGuard (temporär gestoppt)
2 GB PiHole
2 GB Ubuntu Server

Wie Du schon richtig schreibst sind das mehr als 8 GB und das ohne Proxmox selber. Wie soll das denn mit 8 GB funktionieren? Wenn dann nur per Swap und dann sind Probleme wohl sicherlich schon vorprogrammiert und man muss sich nicht wundern wenn dann ggf. etwas in die Knie geht und/oder nicht rund läuft. :slightly_smiling_face:

VG JIm