Home Assistant nicht erreichbar (Lösung: Strom aus/an)

Hi,
mein Home Assistant war nun zum zweiten Mal nicht mehr erreichbar. Weder über die interne IP, noch über die externe Adresse.

Ich habe dann das Pi Netzteil ausgesteckt und wieder eingesteckt. Das System ist hochgefahren und lief wieder.

WIe komme ich der Ursache auf die Schliche? Wenn das System ausfällt und ich nicht zuhause bin, kann ich nicht einfach per Strom resetten.

Ich habe einen Raspberry Pi 4 mit SSD (keine Speicherkarte).

Bis du den Fehler gefunden hast, könntest du einen Shelly-Plug benutzen, den du per Shellycloud von Ferne schalten kannst.
Zur Fehlersuche hilft meist ein Blick ins Logfile. Wenn nicht wirds schwer und ein echtes Geduldsspiel.

Vielleicht ist das Pi Netzteil zu schwach, um Pi + SSD ausreichend zu versorgen.

Meinst du das Logbuch was links in der Seitenleiste ist?

http://IP:8123/logbook

Das schließe ich aus. Ich habe das original Raspberry Netzteil und betreibe den Pi damit seit ca. 5 Jahren. Seit Sonntag läuft das System auch wieder stabil.

So schnell würde ich das Netzteil nicht ausschließen…
Gerade wenn du schreibst das du es schon 5 Jahre nutzt.
Die Dinger können auch altern.
Vielleicht war es immer so gerade an der Grenze und jetzt ist es halt drüber…

Ok, ich werde das beim nächsten Neustart tauschen. Ich habe nocjh eines hier.

Wie würde sich der Pi denn bei einem zu schwachen Netzteil verhalten?
Die LED war noch an, ansonsten kann ich nichts dazu sagen. Der Lüfter läuft temperaturgesteuert und war aus.

Mein Logbuch von Sonntag sieht so aus (um 20:58:01 lief das System noch, 21:38 Uhr war nach dem Reboot):

Gelber Sack geändert zu Abholung in 12 Tagen 21:38:13 - Vorgestern
Papier geändert zu Abholung in 6 Tagen 21:38:13 - Vorgestern
Bio geändert zu Abholung in 6 Tagen 21:38:13 - Vorgestern
Rest geändert zu Abholung in 2 Tagen 21:38:13 - Vorgestern

082_Waschmaschine Remaining time geändert zu 0:00:00 20:58:01 - Vorgestern
082_Waschmaschine Pre state geändert zu Schleudern 20:58:01 - Vorgestern
082_Waschmaschine Spin speed geändert zu Nicht ausgewählt 20:58:01 - Vorgestern
082_Waschmaschine Run state geändert zu Fertig 20:58:01 - Vorgestern
082_Waschmaschine Door lock ausgeschaltet 20:58:01 - Vorgestern
082_Waschmaschine Run completed eingeschaltet 20:58:01 - Vorgestern

Unter Einstellungen/System/Protokolle habe ich unter Home Assistant Core keien Meldung, die älter als Sonntag 21:43 Uhr ist.

Hi,

als ich gerade nach Hause kam, war HA wieder nicht erreichbar. Ich habe das Netzteil jetzt getauscht.

Unter den Protokollen stehen nur die Einträge seit dem Reboot.

Im Logbuch steht:

Bio geändert zu Abholung in 4 Tagen 18:24:44 - Vor 3 Minuten
Rest geändert zu Abholung Morgen 18:24:44 - Vor 3 Minuten
100_Buero_NSPanel_100_Blueprint ausgelöst durch Ereignis 'state_changed' 09:46:27 - Vor 9 Stunden
6_Deye_Wechselrichter Date Time geändert zu 2025-05-05 9:44:53 09:46:00 - Vor 9 Stunden
Datum & Uhrzeit geändert zu 2025-05-05, 09:46 09:46:00 - Vor 9 Stunden
100_Buero_NSPanel_100_Blueprint ausgelöst durch Ereignis 'state_changed' 09:45:27 - Vor 9 Stunden

Was mache ich jetzt?

Warten ob es die nächsten Tage wieder ausgeht, dann kannst du fa st davon ausgehen das der PI ne Macke hat, Monitor dranstecken wäre noch ne Möglichkeit um zu sehen ob er wirklich aus ist oder freezed. Und das mit dem Shelly was weiter oben vorgeschlagen wurde ginge auch noch.
Sogar ohne Cloud, man kann ein kleines Script reinmachen, „wenn 10min nicht anpingbar → Steckdose aus, 1sek warten, Steckdose an“
Ich hab sowas in meinen Shellys nur das der Shelly dann rebootet, da die früher abundzu mal das WLAN verloren haben. Keine Ahnung ob ich es überhaupt noch brauche :joy:

Danke, das mit dem Monitor mache ich wenn es nochmal passiert.
Ich habe jetzt noch eine Automatisierung für einen wöchentlichen Restart gemacht.
Vielleicht hängt sich das Teil nach eienr gewissen Laufzeit auch auf.

Moin,

Nein!

Leider wieder das Denglisch :stuck_out_tongue:

Das, was du suchst, ist Protokoll, findest du dann hier



Die originalen Netzteile waren eher da als die SSD, und eine SSD braucht mehr als so eine SD-Karte :wink:

Das ist ja das Blöde, das kann man nicht genau sagen, ist ja keine Lampe, die einfach dunkler wird, wenn die CPU gerade ackert, dann kann es zu Rechenfehlern kommen, oder beim Schreiben auf die SSD halt zu Fehlern in der Datei, oder zig andere Möglichkeiten.

Das ist auch kein Indiz!

Wenn es wieder passieren sollte, dann solltest du nach dem Strom aus/an, ins Terminal oder einen Editor von HA gehen und dir das Logfile anschauen, mit der 1 am ende, denn das ist das vor dem Neustart, hier Beispiel im VSC

VG
Bernd

Die Datei habe ich gerade geöffnet. Sie hat leider über 35.000 Zeilen, ich verzichte daher drauf, die hier zu posten.
Am Ende steht:

zeep.exceptions.Fault: error time
2025-05-05 01:59:50.358 ERROR (MainThread) [custom_components.tapo_control] Failed to sync time for 192.168.158.211: error time
Traceback (most recent call last):
  File "/config/custom_components/tapo_control/__init__.py", line 583, in async_update_data
    await syncTime(hass, entry.entry_id)
  File "/config/custom_components/tapo_control/utils.py", line 1623, in syncTime
    await device_mgmt.SetSystemDateAndTime(time_params)
  File "/usr/local/lib/python3.13/site-packages/zeep/proxy.py", line 64, in __call__
    return await self._proxy._binding.send_async(
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    ...<5 lines>...
    )
    ^
  File "/usr/local/lib/python3.13/site-packages/zeep/wsdl/bindings/soap.py", line 164, in send_async
    return self.process_reply(client, operation_obj, response)
           ~~~~~~~~~~~~~~~~~~^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.13/site-packages/zeep/wsdl/bindings/soap.py", line 229, in process_reply
    return self.process_error(doc, operation)
           ~~~~~~~~~~~~~~~~~~^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.13/site-packages/zeep/wsdl/bindings/soap.py", line 391, in process_error
    raise Fault(
    ...<5 lines>...
    )
zeep.exceptions.Fault: error time
2025-05-05 02:18:10.864 ERROR (Thread-6) [pychromecast.socket_client] [Nest Hub(192.168.158.179):8009] Error reading from socket: socket connection broken
2025-05-05 02:18:10.873 ERROR (Thread-6) [pychromecast.socket_client] [Nest Hub(192.168.158.179):8009] Failed to connect to service HostServiceInfo(host='192.168.158.179', port=8009), retrying in 5.0s
2025-05-05 02:23:20.874 ERROR (Thread-5) [pychromecast.socket_client] [Nest Mini S(192.168.158.119):8009] Failed to connect to service HostServiceInfo(host='192.168.158.119', port=8009), retrying in 5.0s
2025-05-05 02:34:05.786 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Error reading from socket: socket connection broken
2025-05-05 02:34:05.791 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Failed to connect to service HostServiceInfo(host='192.168.158.188', port=8009), retrying in 5.0s
2025-05-05 04:37:49.718 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Error reading from socket: [Errno 104] Connection reset by peer

192.168.158.119 = ein Nest Mini
192.168.158.179 = ein Nest Hub
192.168.158.188 = ein Fernseher
192.168.158.211 = eine Überwachungskamera draußen

Heute nacht um 4.37 Uhr hatte ich laut Fritzbox einen Reconnect vom DSL

Nach 4.37 Uhr steht nichts im log.
Ich bin heute um 5.45 Uhr aufgestanden und danach zur Arbeit gefahren. Da lief noch alles.

Moin,

das ist richtig so und Du musst natürlich nicht die ganze Datei hier zeigen, Du muss sie Dir anschauen, dann da wo Error vorkommt lesen und schauen, was es bedeutet, oft sind es ja Fehler in Integrationen, die diese Errors melden, z. B. hier von einer HACS Erweiterung Tapo Control

2025-05-05 01:59:50.358 ERROR (MainThread) [custom_components.tapo_control] Failed to sync time for 192.168.158.211: error time

Diese Meldungen kommen von Chromecast

2025-05-05 02:18:10.864 ERROR (Thread-6) [pychromecast.socket_client] [Nest Hub(192.168.158.179):8009] Error reading from socket: socket connection broken
2025-05-05 02:18:10.873 ERROR (Thread-6) [pychromecast.socket_client] [Nest Hub(192.168.158.179):8009] Failed to connect to service HostServiceInfo(host='192.168.158.179', port=8009), retrying in 5.0s
2025-05-05 02:23:20.874 ERROR (Thread-5) [pychromecast.socket_client] [Nest Mini S(192.168.158.119):8009] Failed to connect to service HostServiceInfo(host='192.168.158.119', port=8009), retrying in 5.0s
2025-05-05 02:34:05.786 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Error reading from socket: socket connection broken
2025-05-05 02:34:05.791 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Failed to connect to service HostServiceInfo(host='192.168.158.188', port=8009), retrying in 5.0s
2025-05-05 04:37:49.718 ERROR (Thread-4) [pychromecast.socket_client] [TV(192.168.158.188):8009] Error reading from socket: [Errno 104] Connection reset by peer

Das waren Meldungen von Gestern 05.05. um ~ 2 Uhr und der letzte von ~ 04:30 Uhr

Eine Zwangstrennung beim Provider, sollte nicht dazu führen, dass Geräte in Deinem Netzwerk die Verbindung verlieren, dazu müsstest Du aber viel mehr von Deinem Netzwerk beschreiben, welche Geräte, Switche, Router, welche Einstellungen usw.

Das ist auch ok, ich habe ja gesagt, dass wenn man Strom aus/an, gemacht hat in das Logfile mit der 1 am Ende schauen soll, da es das Logfile ist welches vor dem Strom aus aktiv war.
Wenn Dein Rechner läuft, dann wird das Logfile auch rotiert, entweder nach Erreichen einer bestimmten Größe oder nach Erreichen einer Zeit, z. B. 00:00 Uhr Nachts.

Also solange alles läuft, ist doch gut, wenn es wieder passiert, dann schauen was im Logfile steht.

VG
Bernd