Homeassistant "got stuck" die zweite

Moin,

ich habe mir jetzt noch mal alle Postings hier im Beitrag durchgelesen und zwischenzeitlich hat ja auch ein Systemwechsel von Raspi 4 auf Raspi 5 stattgefunden. Das Thema Netzteil stark genug wurde auch schon geklärt und das das Problem zu Anfang mal für rund einen Monat verschwunden war macht es auch nicht leichter.

Das hier verstehe ich noch nicht so ganz

Du hattest doch geschrieben das Du eine SSD einsetzt. Wo kommt jetzt eine SD-Karte ins Spiele? Hattest Du Die nur für eine Installation genutzt oder was oder wie?

Dann das Thema

Die Proxy-Einstellungen bei HA sollten eigentlich so aussehen

http:
  use_x_forwarded_for: true
  trusted_proxies:
    - 172.30.33.0/24 

sprich einen IP-Bereich abdecken und nicht einzelne IPs. Mit einzelnen IPs sollte es zwar auch funktionieren, aber bei Deinen o.g. Fehlermeldungen zu irgendwelche API-Zugriffen und Verbindungsproblemen, könnte es da ja ggf. einen Zusammenhang geben. Die HA-Doku sagt dazu:

trusted_proxies string | list (Optional)
List of trusted proxies, consisting of IP addresses or networks, that are allowed to set the X-Forwarded-For header. This is required when using use_x_forwarded_for because all requests to Home Assistant, regardless of source, will arrive from the reverse proxy IP address. Therefore in a reverse proxy scenario, this option should be set with extreme care. If the immediate upstream proxy is not in the list, the request will be rejected. If any other intermediate proxy is not in the list, the first untrusted proxy will be considered the client.

Aber das ist nur eine Vermutung von mir.

Da Du ja zwischenzeitlich den Wechsel zum Raspi 5 gemacht hast: Ich an Deiner Stelle hätte bei dem nicht direkt und sofort das HA-Backup eingespielt, sondern den erst einmal - zumindest 1 - 2 Tage lang - ohne das Backup einzuspielen laufen lassen, um zu sehen ob eine Standard-HA-Installation dann ohne diese Probeme funktioniert. Das Backup könntest Du ja auch immer noch später einspielen.

Dadurch könntest Du schon mal ausschließen das es irgendein Zugriffsproblem in Deinem LAN gibt, was ja durchaus immer noch möglich ist und hier ja auch schon angesprochen wurde. Wenn also einen Standard-Installation von HA 1 - 2 Tage ohne diese Probleme funktioniert weißt Du schon mal das irgendetwas an Deiner alten Installation die Probleme verursacht und kannst dann Deine Fehlersuche darauf beschränken.

Da Du jetzt inzwischen ja schon Erfahrungen zu einer HA-Install. sammeln durftest :slightly_smiling_face: und somit eine neue HA-Installation ja keine große Hürde mehr sein sollte, würde ich Dir auch empfehlen genau so vorzugehen. D.h. den Raspi 5 und dessen SSD platt machen. Dann HA neu installieren und nur das einrichten was von HA automatisch gefunden wird. Keine zusätzlichen Addons oder Integrationen installieren! Damit dann den Raspi 1 - 2 Tage lang laufen lassen und schauen ob das Problem wieder auftaucht. Falls nein solltest Du ein Hardware-Problem, oder ein Zugriffsproblem aus dem LAN heraus, ausschließen können und Du kannst Dich dann Deiner alten Installation und Deinen Backup davon, zuwenden.

VG Jim

Stimmt, der Bereich stand schon drin, aber erst seit dem ich die beiden IPs explizit ergänzt habe ist Ruhe. Ist zwar unlogisch, da ja der ganze Netzbereich eigentlich freigegeben ist. Leerzeichen usw. hatte ich natürlich geprüft.
Hatte damals dazu auch nen Foreneintrag gefunden, muss mal suchen, ob ich den noch finde.

Ich hatte die SSD ausgesteckt und von einer völlig neuen SD Karte gebootet. Das System hatte ich eine weile laufen lassen und die bei mir vorhandenen Geräte wurden erkannt. Ich konnte dieses System ohne Probleme bedienen, habe aber keine weiteren Konfigurationen vorgenommen. Damit wollte ich einen Hardwarefehler ausschließen.

Dass das Problem-System sowohl auf dem Raspi4 als auch auf dem Raspi5 das gleiche Verhalten zeigt ist m.E. auch ein Hinweis, dass kein Hardwarefehler die Ursache ist.

sieht bei mir so aus:

http:
  cors_allowed_origins:
    - https://google.com
    - https://www.home-assistant.io
  ip_ban_enabled: true
  login_attempts_threshold: 5
  use_x_forwarded_for: true
  trusted_proxies:
    - 172.30.33.0/24

… den Ratschlag werde ich mal umsetzen. Da stellt sich mir die Frage ob man zwei HA Systeme, zwar mit unterschiedlichen IP’s, in einem Netzwerk laufen lassen kann. Das “kaputte” System sammelt ja nach wie vor Messwerte ein, worauf ich ungerne verzichten möchte …

:crayon:by HarryP: Zusammenführung Doppelpost (bitte “bearbeiten” Funktion nutzen)

Klar kann man das machen. In Deinem Fall wirst Du ja dann nur ein bereits bestehendes “Produktivsystem” und ein “Testsystem” mit Minimal-Einrichtung laufen lassen. Mache ich schon immer in der Art mit mehreren HA Installationen in verschiedenen VM und die laufen dann auch parallel. Zwei Produktivsysteme parallel laufen zu lassen kann schon mal zu Problemen führen, aber nicht ein Produktiv- + ein Testsystem (mit Minimal-Einrichtung).

Die Frage ist nur willst Du dann den Raspi 5 so wie er jetzt ist laufen lassen und dann den Raspi 4 für die neue Testinstallation benutzen oder umgekehrt.

Ach ja - eine weitere SSD solltest Du dann natürlich auch noch zur Verfügung haben. Aber kleinere SSD hat man ja meist noch in irgendeiner Schublade herumliegen. :slightly_smiling_face:

VG Jim

Auf dem Raspi5 läuft das Produktivsystem, auf dem Raspi4 das Testsystem.

ja eine zweite SSD habe ich sowieso auf dem jetzt ds Testsystem läuft

Das läuft gerade bei mir so und ich werde berichten wie es weiterläuft

Noch etwas:
Bei mir sind Bewegungsmelder in Betrieb, die ich hier schon mal beschrieben habe.:

Die laufen unter Zuhilfenahme einer “custom quirks” unter /config/custom_zha_quirks/ts0601-pirmotion.py

Diese Datei hatte ich auch im Verdacht und habe sie umbenannt. Allerdings scheint sie nicht ursächlich für den Fehler zu sein.

1 „Gefällt mir“

Alles ist möglich, :slightly_smiling_face: aber auch das könntest Du ja ganz einfach testen in dem Du die mal deaktivierst und/oder ZHA einfach mal still legst. Wobei wir dann wieder bei dem hier bereits erwähnten Thema wären: Alle Addons und Integrationen deaktivieren, dann Zug um Zug wieder aktivieren und immer wieder testen. Dabei immer wieder in den Protokollen und Logs nachschauen ob und welche Auffälligkeiten es ggf. gibt.

VG Jim

ja, da hab ich schon mehrfach gemacht bzw. bin laufend damit mit beschäftigt.

Eins noch: es is so dass das Produktivsystem nach sich nach einer Weile wieder meldet, meistens nach ca. 15 Minuten. Man erkennt, dass es dann gerade einen Neustart durchführt …

Sorry aber auch nach mehrmaligen lesen :slightly_smiling_face: verstehe ich nicht was Du mit wieder melden meinst und was hat das mit Produktivsystem zu tun? Egal was für HA-System das “meldet” sich nicht und macht auch nach ca. 15 Minuten keinen Neustart.

So für heute bin ich dann auch offline, sprich eine/Deine Erklärung was Du damit meinst lese ich frühestens erst morgen. :slightly_smiling_face:

VG Jim

das hatte ich hier im 2ten Absatz schon mal beschrieben: Homeassistant "got stuck" die zweite - #42 von georgy_boy

Es ist halt so, dass nach ca. 15 Minuten unten links nicht mehr “Verbindung getrennt. Wird erneut verbunden …” steht sondern Meldungen wie “Komponente xy fährt gerade hoch und ist noch nicht erreichbar …” und schließlich “HA ist komlett gestartet”. Dann kann man eine gewisse Zeit mit dem System aggieren, bevor wieder “Verbindung getrennt. Wird erneut verbunden …” erscheint … usw.
grafik

Gerade konnte ich aus den Supervisorlogs folgende in rot geschriebenen Zeilen herauskopieren:

2024-04-07 22:42:46.119 ERROR (MainThread) [supervisor.homeassistant.api] Timeout on call http://172.30.32.1:8123/api/core/state.
2024-04-07 22:42:46.119 ERROR (MainThread) [supervisor.misc.tasks] Watchdog missed 2 Home Assistant Core API responses in a row. Restarting Home Assistant Core API!

2024-04-07 23:28:24.060 ERROR (MainThread) [supervisor.api.ingress] Stream error with http://172.30.33.2:1337/public/build/6377.45d36c143a694fc45bd3.js: Cannot write to closing transport

Moin :slightly_smiling_face:

Erst einmal zu dem “wieder melden”: OK ich hatte angenommen das Du damit noch irgendeine Besonderheit zum ausdrucken bringen wolltest und/oder irgendeine bestimmte Frage dazu hast, aber dem ist ja nicht so. Das normale Boot- bzw. Neustart-Verhalten bei HA ist halt so das Du unten links angezeigt bekommst was gerade während des Boot-/Neustart-Prozesses passiert. Sobald HA den Boot-/Neustart-Prozess abgeschlossen hat gibt es unten links keinerlei Meldungen mehr. Bei Dir halt schon weil Dein ganzes System halt total instabil läuft.

Nun zu Deinen div. supervisor.homeassistant.api Fehlermeldungen: Nur anhand dieser Fehlermeldungen lässt sich quasi keine genaue Ursache bestimmen. Diese Fehlermeldungen können die unterschiedlichsten Ursachen haben und zeigen eigentlich nur das bei Dir irgendetwas im Argen liegt.

Oftmals tauchen solche Fehlermeldungen z.B. dann auf wenn ein Addon oder eine Integration das System zu sehr auslastet, sodass andere Prozesse (z.B. Aufruf von APIs) nicht, oder nicht zeitnah erfolgen. Dann läuft das z.B. in einen Timeout. Sollte es von einem bestimmten Addon, oder einer bestimmten Integration verursacht werden, erkennt man das oftmals auch noch daran das es in den HA-Protokollen dazu noch weitere Hinweise gibt. Manchmal kann man auch ganz grobe Rückschlüsse ziehen wenn man sich die Startzeiten der Addons/Integrationen mal anschaut


HA_Startzeit
D.h. wenn dort ein Addon bzw. eine Integration mit z.B. einem dreistelligen Sekundenwert auftauchen sollte weiß man schon mal das da irgendetwas im Argen liegt, denn das wäre nicht normal.
Beispiel von anderen Usern bei denen es scheinbar an einem Addon lag:

Aber diese supervisor.homeassistant.api Timeouts/Fehler können leider auch noch ganz andere Ursachen haben und nicht nur von einem bestimmten Addon, oder einer bestimmten Integration verursacht werden. Das geht soweit das es bei einzelnen Usern sogar dazu geführt hat das sie ihren Router ausgetauscht haben und dann scheinbar das Problem weg war. Wie Du hier nachlesen kannst:

Oder bei manchen hat es gehoften das sie HA eine feste IP gegeben haben und nicht per DHCP-Server. Leider aber eben auch genau anders herum.

D.h. diese supervisor.homeassistant.api Timeouts/Fehler und der daraus natürlich total instabile Betrieb von HA, können die unterschiedlichsten Ursachen habe und nur anhand dieser Fehlermeldungen ist es leider nicht möglich die genaue Ursache zu finden.

Im Moment würde ich einfach mal abwarten wie sich der Raspi 4 mit der HA-Minimal-Installation verhält und ob das Problem bei dem dann auch wieder auftaucht. Falls nein kannst Du schon mal ziemlich sicher die Hardware der beiden Raspi ausschließen und vermutlich ebenfalls irgendwelche sonstigen Netzwerkprobleme. D.h. dann ist es sehr wahrscheinlich das Deine alte HA-Installation, die ja jetzt auf dem Raspi 5 läuft, irgendein Problem hat. Sei es bei irgendeine Konfigurationseinstellung, und/oder mit einem Addon oder einer Integration. Ob man/Du dieses Problem dann dort findet muss/wird sich zeigen.

VG Jim

nun, es ist die “devolo-Integration” die ca. 20 Sekunden braucht, was noch lange nicht dreistellig ist und mir eher plausibel erscheint:

Ich habe jetzt spaßeshalber mal auf dem raspi4 mit dem frischen Testsystem grafana installiert und die influx Datenbank die auf dem raspi5 auf Port 8086 läuft eingebunden. Das funktioniert durchgehend ohne Unterbrechung :neutral_face:

eine feste IP habe ich schon über ein Jahr.

:crayon:by HarryP: Beitrag wieder hergestellt, da bereits darauf geantwortet wurde.

Lieber nicht ungeduldig werden und das Raspi 4 Test-System schon wieder mit irgendwelchen Addons belasten. :wink: Wie Du Dich ja sicherlich erinnern kannst hattest Du auch schon die Situation das auch die alte Installation mal über Tage hinweg keine Probleme gemacht hat. Wenn Du jetzt schon wieder mit irgendwelchen Addons und Integrationen auf dem Raspi 4 Test-System “herumspielst” und in drei - vier Tagen zickt der Raspi 4 dann ggf. auch herum, stehst Du ggf. wieder da und weißt nicht genau was die Ursache dafür ist.

Ist halt nur ein gut gemeinter Ratschlag. :slightly_smiling_face:

VG JIm

ok, ist schon alles wieder gelöscht. Mir ging es darum ob die ifluxdb ansprechbar ist.

Gerade habe ich mal mehrere Templatesensoren deaktiviert, mal schauen …

Heute habe ich den ganzen Nachmittag am Rechner gearbeitet und hatte die beiden System nebenbei auf dem zweiten Bildschirm im Blick. Die Raspis liegen direkt neben mir auf dem Schreibtisch. Der Raspi5, auf dem das ProblemHA läuft hat ja im Gehäuse einen kleinen Lüfter. Der fing ca. alle 15 Minuten an hörbar zu laufen, was ja auf Systemaktivität hindeutet. Zugleich hat das System nicht mehr geantwortet. Wenn es dann nach ca. 15 Minuten wieder antwortet ist es schon nach Sekunden wieder weg. Ich kann gerade noch den supervisor-log auslesen (Zwischendurch habe ich für den Supervisor die Debug-Protokollierung angeschaltet):

2024-04-09 22:07:05.120 ERROR (MainThread) [supervisor.misc.tasks] Watchdog missed 2 Home Assistant Core API responses in a row. Restarting Home Assistant Core API!
2024-04-09 22:07:05.124 INFO (SyncWorker_3) [supervisor.docker.manager] Restarting homeassistant
2024-04-09 22:16:35.120 ERROR (MainThread) [supervisor.homeassistant.api] Timeout on call http://172.30.32.1:8123/api/core/state.
2024-04-09 22:16:35.120 ERROR (MainThread) [supervisor.misc.tasks] Watchdog missed 2 Home Assistant Core API responses in a row. Restarting Home Assistant Core API!
2024-04-09 22:16:35.123 INFO (SyncWorker_6) [supervisor.docker.manager] Restarting homeassistant
2024-04-09 22:21:08.819 INFO (MainThread) [supervisor.homeassistant.core] Home Assistant Core state changed to RUNNING
2024-04-09 22:21:08.819 INFO (MainThread) [supervisor.homeassistant.core] Detect a running Home Assistant instance
2024-04-09 22:22:08.670 INFO (MainThread) [supervisor.homeassistant.api] Updated Home Assistant API token
2024-04-09 22:28:19.968 INFO (SyncWorker_7) [supervisor.docker.manager] Restarting homeassistant
                                            Das war ich über das UI     ^^^^^^^^^^^^^^^^^^^^^^^^
2024-04-09 22:28:20.044 WARNING (MainThread) [supervisor.homeassistant.websocket] Connection is closed
2024-04-09 22:28:36.188 INFO (MainThread) [supervisor.homeassistant.core] Wait until Home Assistant is ready
2024-04-09 22:28:38.530 INFO (MainThread) [supervisor.resolution.evaluate] Starting system evaluation with state running
2024-04-09 22:28:38.600 INFO (MainThread) [supervisor.resolution.evaluate] System evaluation complete
2024-04-09 22:28:41.195 INFO (MainThread) [supervisor.homeassistant.core] Home Assistant Core state changed to NOT_RUNNING
2024-04-09 22:29:06.244 INFO (MainThread) [supervisor.homeassistant.core] Home Assistant Core state changed to RUNNING
2024-04-09 22:29:06.244 INFO (MainThread) [supervisor.homeassistant.core] Detect a running Home Assistant instance

Nächster Schritt wir sein, dass ich “Better-Thermostat” deaktiviere.

Der Raspi4 lief einfach durch und war durchgehend da.

Hallo Zusammen,

vermutlich habe ich die Lösung !! Wie angekündigt habe ich gestern Better-Thermostat deaktiviert. Dazu habe ich das Verzeichnis /homeassistant/custom_components/better_thermostat umbenannt und somit für die Integration unzugänglich gemacht. Anschließend habe ich einen Neustart vorgenommen, der sehr schnell erledigt war und von da an gab es keine “Trennung der Verbindung” mehr. Im Gegenteil, das System reagierte sehr perfomant :man_lifting_weights:.
Innerhalb der noch vorhandenen Integration wurde die einzelnen Integrationseinträge als “! nicht geladen” angegeben:
grafik
Nach ca. 6 Stunden habe ich “Better-Thermostat” wieder aktiviert um zu Prüfen ob die “Trennung der Verbindung” wieder auftritt. Nach weiteren 12 Stunden Betrieb war da tatsächlich der Fall. Daher wieder abgeschaltet und alles ist gut.

Jetzt könnte man untersuchen, ob es an Better-Thermostat (bei mir Version 1.4.0) generell, oder ob es an einem der 11 Stück bei mir vorhandenen Integrationseinträgen liegt. Aber das sind Abenteuer, die in einem anderen Teil des Märchenwaldes stattfinden …

1 „Gefällt mir“

Die Version ist vom 31.10.23, also inzwischen einige HA Versionen alt. Scheinbar gibt es damit inzwischen auch andere Probleme bzw. mit der aktuellen 1.5.0 Beta 7 (aus Februar 24) sind einige andere Probleme gelöst.

Vielleicht hast Du ja noch die Lust zu updaten und zu testen, ob es damit behoben ist oder das Problem weiterhin auftritt.

Klar, das mache ich gerne, beizeiten, die Heizperiode ist ja bald vorbei. Daher bei mir nicht Prio 1 …

1 „Gefällt mir“

Hallo Zusammen, nach dem Update auf die Version 1.5.0 von Better Thermostat sind die Ausfälle der HA-UI nicht wieder aufgetreten.

2 „Gefällt mir“