Hilfe benötigt -- Home Assistant komplett kaputt

Guten Morgen zusammen.

Ich bin gerade einigermaßen ratlos, da mein Home Assistant leider vollständig kaputt ist.
Ich habe mir die Nacht um die Ohren gehauen auf dem CLI und da drin rum gestochert, aber das hatte alles keinen Erfolg.

Was mich nun aber am meisten schockiert: ich habe dann ein 3 Tage altes Backup der Proxmox VM eingespielt, und auch dieses hat nun den gleichen Fehler.

Der Stand ist folgender:

  • Die Observer-URL funktioniert und zeigt alles grün an (connected, connected, healthy)
  • die Konsole der VM steht an einem prompt ha>
  • wenn die VM bootet, dann zieht sie auf dem Router ihre IP und ist über Ping ansprechbar

Ab hier bin ich komplett hilflos, insbesondere da ich kein “normales” Linux zum navigieren habe dort.

Und wieso sollte das Backup den gleichen defekt haben, mein HA lief doch die letzten Tage ganz normal ohne irgendwelche Probleme?

Hat jemand eine Idee, ob hier noch etwas zu retten ist? – Es ist ja noch ein wenig Leben drin.

Danke & viele Grüße,
Marcus

Du schreibst Proxmox und Observer. Vermutlich VM mit Homematic OS.

Observer Url hat einen anderen Port als die Weboberfläche. Irgend eine Firewall dazwischen? Firewall in Proxmox mal abgeschaltet? Proxmox Update eingespielt? Proxmox Reboot und dadurch ein Update aktiviert wie. z. B. neuer Kernel?

Ach so, es fällt übrigens auf, dass das System sehr langwierig bootet.
Es steht nun am Prompt mit der Info: Error returned from Supervisor: System is not ready with state: setup"

Wenn ich dort “banner” drücke, dann zeigt er mir die Info mit den URLs an, das nützt aber nichts weil HA eben nicht erreichbar ist im Browser.help.

Wenn ich ha> mounts info angebe, dann schaut das komisch aus:

default_backup_mount:  null
mounts: []

ha> supervisor repair --log-level=debug bringt ebenfalls nichts, allerdings wird blau hervorgehoben: “no config file found”.

Das system ist sowieso defekt und du hast ein Backup, versuche mal

ha >  supervisor repair
ha >  supervisor restart

Sollte das nichts bringen teste mal

ha > banner

scheint ein Netzwerkproblem zu sein. Starte auch mal deinen Router neu

Netzwerkproblem habe ich auch in Verdacht, das ist die einzige Baustelle der vergangenen Tage. Aber ich habe parallel auch gesehen, das meine Proxmox “local” Festplatte 100% gefüllt ist, evtl. hat der Restore nicht geklappt deshalb.

Sehr unübersichtlich.

Das bringt alles nicht leider :-/

warte nochmal einige Minuten und probiere es dann nochmal mit

ha > banner

Ansonsten mal im Router schauen, ob der HA eine andere ip bekommen hat oder gar mit WLAN zusätzlich auftaucht

Der hat eine feste IP in der OPNsense, und die ändert sich auch nicht.
Ich hatte Änderungen gemacht am DNS, und die Reihenfolge von Unbound DNS und Adguardhome getauscht. Evtl. funktioniert nun die Namensauflösung der VMs untereinander nicht.

ja das kann sehr gut sein. Falls DNS nicht funktioniert, kommt auch der Fehler. Am besten das mal Rückgängig machen, dann sollte dein HA wieder gehen

Moin,

So etwas kommt doch nicht von alleine, es ist wichtig, uns mitzuteilen, was Du vorher gemacht hast, das zu diesem Verhalten geführt hat.
Dabei ist es nicht nur interessant, was in HA gemacht wurde, sondern auch in der Peripherie, Router, Server, Proxmox usw.

Das ist auch meist kontraproduktiv, wenn man sich nicht sicher ist,

  1. wo der Fehler liegt
  2. sich mit den Befehlen nicht auskennt
    Mit CLI, meinst Du die Konsole in Deiner Proxmox HA VM?

Das ist nicht schockierend, denn wenn das Problem nicht bei HA liegt, sondern außerhalb, dann ist es egal wie alt oder neu ein Backup ist, denn dann wird es nie funktionieren, weil kein Problem im Backup oder HA!

Das ist ok, denn Dein Problem ist nicht in der HA VM, vermute ich jetzt mal.

Das ist auch ok, denn HAOS ist ein abgeschottetes System, wo man an Linux nicht so ohne weiteres herankommt, und diese HA Konsole, bietet einfach nur die nötigen Befehle um damit zu arbeiten.

Das ist ja auch erst einmal ok, nur ist es auch die IP, mit der Du Dein HA eingerichtet hattest, oder ist es plötzlich eine andere IP, die nicht in der HA Konfiguration genutzt wird, denn dann ist es kein Wunder, dass Du nicht mehr an Deine HA GUI kommst!

Das sollte man normalerweise auch nicht brauchen :wink:
Da helfen zwei kleine Tricks,

  1. Du hättest Dir vorher mal den ssh Zugang einrichten müssen
    Home Assistant SSH Port 22222 (Root Zugriff HA OS) einrichten
  2. wenn Du in der Proxmox HA VM Konsole bist, also das ha> siehst, dann einfach mal login eingeben, dann bist Du im HA Docker angemeldet und findest ein halbwegs normales Linux vor.
ha > login

Wie schon geschrieben, das Backup hat kein Problem, Dein Problem liegt eher außerhalb der Proxmox VM.

Ich habe jetzt gesehen, dass Du schon viele hilfreiche Tipps bekommen hast, daher höre ich hier mal auf und wünsche Dir viel Erfolg beim Lösen des Problems.

VG
Bernd

Wieso Reihenfolge geäandert - das mache mal rückgängig

AdGuard fragt als Upstream-Server Unbound an und darüber werden dann die lokalen Host’s aufgelöst. Du trägst nur AdGuard als DNS in der OPNSense für jedes Netz ein.

Wenn du Konfig-Hilfe brauchst, sagt Beschied, bei mir läuft das genauso

Wenn die Platte vom Proxmox voll ist und der Restore fehlschlägt, bekommst du in dem Task-Fenster aber eine Fehlermeldung.
Am Ende muss “Task ok” sonst war das faul.

Schau mal ob du evtl. also ISO’s oder Backups auf der Platte hast, und mache da Platz.

Hallo zusammen.

Tausend Dank für die vielen Tipps, ich war etwas panisch um 3:30 Uhr und habe den Wald vor lauter Bäumen nicht gesehen.
Also erst mal vorweg: Home Assistant klappt nun wieder. Nun muss ich in Ruhe einige Baustellen beheben, die sich aufgetan haben.

  1. die volle Proxmox-Festplatte muss ich mal verstehen.
  2. den SSH Zugang einrichten
  3. DNS ändern. Adguard ist hier downstream vom Unbound auf der OPNsense im Moment.
  4. ich brauche mal eine Backup-Strategie über Proxmox hinaus, wo ich die Config-Files regelmäßig weg sichere.

Puh, was für ein Zitterpartie :slight_smile:

Gibt ne Backup-Integration ( Samba Backup irgentwas, muss ich nachsehen ) die sichert dir die HA-Config täglich auf externe Medien, z.b. NAS.

Proxmox sicher ich persönlich garnicht, ich hab die Kofiguration der Netzwerkkarte in meinem Dokutool abgelegt und das wars.
Ich sicher nur die VM’s/LXC’s auf meine NAS und wenn Proxmox kaputt ist, setze ich den neu auf und ziehe die VM’s/LXC’s von der NAS zruück per Restore.

Mein Tip, mache es so wie empfohlen:

  • AdGuard ( auf der OPNSense ) ist dein DNS für alle Netze und dort eingetragen
  • Unbound ( auf der OPNSense ) ist dann der Upstream für AdGuard und macht u.a. die Auflösung der lokalen Hostnamen.

Moin,

Das ist genau der falsche Ansatz, wenn man Panik schiebt, dann sollte man erst recht einmal Abstand suchen und unausgeschlafen macht man mehr Fehler als dass was Gutes dabei herauskommt :wink:

Ich denke mal nicht, dass Du die Platte von Proxmox, meinst, sondern die Virtuelle Disk der HA VM, oder?

Das kann man machen, ist für den Notfall, mitunter ganz nützlich, ich habe es Got sei Dank noch nie gebraucht :slight_smile:

Da kann ich nichts zu beitragen, da ich zwar AdGuard nutze, aber OPNsense nicht.

VG
Bernd

Mit Proxmox Backup meinte ich, dass ich ich meine LXCs und VMs täglich auf einen PBS sichere. Das hat 2 Jahre super funktioniert, und ich konnte auch immer zurück sichern.

Nur die Erfahrung, dass diese Rücksicherung nicht klappt, die zwingt mich jetzt doch lieber dazu, die Config-Files für den Notfall wegzusichern.
Vor einer Weile funktionierte dieses Nexcloud-Plugin auch noch. Aber das tut es nicht mehr seit letztem Jahr.

Mal zu dem DNS Setup:

  • Ich habe hier seit 1.5 Jahren Unbound auf der OPNsense als primären DNS laufen. Der wird per DHCP an die Clients verteilt und soll meine lokalen Clients auflösen können, was aber leider auch nicht immer 100% funktioniert. (Register DHCP leases, Register DHCP static mappings).
  • Der Unbound leitet bei Query Forwarding an Adguard weiter
  • Im Adguard sind diverse Blocklists angelegt, sowie mehrere externe DNS-Server

Das funktionierte, lediglich die Statistik ist schräg weil so ja die OPNsense als alleiniger Client 100% der Anfragen stellt. Aber das war nie wichtig.

Du hast das genau umgedreht konfiguriert? – Client → Adguard → Router → …

Im Prinzip hätte ich gerne ein Konzept, welches den Ausfall der zusätzlichen Adguard-VM toleriert und weiter funktioniert, wenn diese VM mal ausfallen sollte.
Also so, als wäre die Route über Adguard “optional”. (“Nutze sie, falls vorhanden, und gehe sonst direkt nach extern”) Das habe ich aber noch nicht hinbekommen.

Hi Bernd.

Nein, ich meinte nicht meine virtuelle Festplatte von HA, sondern tatsächlich die Proxmox Platte. Um genauer zu sein, da ich Proxmox diesbezüglich nie ganz verstanden habe: die “local” Platte.

Die ist “nur” 100GB groß, der Rest des Storage liegt in einem “zfspool”, aber dort wird er anscheinend nicht gut genutzt, weil ich nicht so richtig einstellen kann was jeweils wo landet.

Grüße,
Marcus

Das macht eben keinen Sinn - Unbound nutzt direkt die ROOT-DNS-Server, die sind fest konfiguriert

Warum lässt du AdGuard nicht auf der OPNSense laufen, besser Lösung gibt es nicht.

Tja, warum?
Das schaue ich mir mal an. Ich wollte eigentlich die OPNsense nicht überfrachten mit zu vielen 3rd-Party-Erweiterungen. Das war die Idee dahinter.

Moin,

Dann hast Du ein generelles Problem, leider zeigst Du nichts und nur von Deinen Erzählungen kann ich das nicht Beurteilen :wink:

local

Also, die Local Disk ist, genau das was es sagt Lokal und dient für die Ablage von

  • Backups (sollte nur für kurzfristige Backups genutzt werden, die man anschließen wieder löscht)
  • ISO-Images
  • LX Container Images

In Local sollte man keine virtuellen Disks von VMs, oder LX Container legen!

local-vm

Wird auch beim Einrichte von Proxmox mit angelegt, ist ein Logical Volume, dient zur Ablage von Virtuellen Disks für VMs und LX Container, kann, wenn man die Platte nicht ganz aufgeteilt hat auch vergrößert werden

zfs4cluster

Das ist bei Dir der ZFS Pool, dieser ist auch so angelegt worden, dass er für die Aufnahme von virtuellen Discs genutzt wird

Wenn Du jetzt z. B. bei der HA VM schaust, wo das Root-File-System liegt, dann sieht das bei mir so aus

Oder für ein LXC

Und was steht da bei Dir?
Ich denke, Du hast alles in den local geschrieben, reine Vermutung.
Sollte dem so sein, dann kannst Du das so korrigieren

Das klappt auch weiterhin, nur wenn Dein System verhunzt ist, was soll dann Proxmox, bzw. das Backup machen, Du bist der Admin, Du hast Dich darum zu kümmern das alles funktioniert, das Ordnung in Deinem System herrscht :wink:

VG
Bernd