Hallo Zusammen,
ich wende mich mal an euch, weil ich einfach nicht weiter komme.
System:
Raspi 5, 8GB, Raspi Netzteil mit 27Watt, NVMe PCIe Board und 256GB Samsung SSD
Sonoff Dongle-E für Zigbee, Sonoff Dongle Plus MG24 (vorher auch der Dongle-E) für Matter over Thread.
Zigbee2MQTT mit 60 Geräten (35 Router und 25 Endgeräte)
10 Matter Geräte
HomaticIP Integration
Nabucasa-Cloud mit täglichem Backup
So ist bei mir die Hardware seit über einem Jahr im Betrieb aber immer fehlerbehaftet und ich finde den Übeltäter nicht.
Ansonsten laufen nicht viele Integrationen, alles nur so basic-Einsteigerkram.
Fehlerbild: Meistens ist HA nicht mehr erreichbar und im Haus funktioniert nichts mehr. Manchmal ist HA noch erreichbar und nur Z2MQTT ist ausgestiegen. Matter-Geräte lassen sich dann noch bedienen. Z2MQTT lässt sich aber nicht mehr starten, auch ein HA-Neustart über die Software bringt nichts. Einzige Möglichkeit das ganze wieder zum Laufen zu bekommen ist, das ganze System stromlos zu machen und “hart” neu zu starten. Danach läuft alles reibungslos.
Zu den Zeitabläufen kann ich nicht viel sagen. Manchmal ist wochenlang Ruhe, dann braucht es täglich 1 bis 2 Neustarts. Auch unabhängig von Uhrzeiten oder ob das System benutzt wird oder nicht.
- Ich habe so gut wie alle Integrationen deaktiviert - ohne Erfolg
- Unterschiedlichste Firmware auf den Dongles getestest (es läuft überall grad die neuste Firmware)
- Dongles getauscht
- ohne Thread-Stick betrieben und diesen auch gegen den MG24 getauscht
- CPU, Auslastung, Temperaturen → alles Ok
- Spannungsunterversorgung sollte bei dem Netzteil auch nicht vorliegen
Fehlerlogs:
- in den Logs steht meist nichts drin!
- und wenn etwas drin steht, dann sind es manchmal Datenbankfehler, Fehler in Python3 oder Error fetching info
Was Code angeht kenn ich mich aber nicht aus und probiere bisher nach dem Ausschlussprinzip dem Fehler auf die Spur zu kommen. Aber das zieht sich nun seit einem Jahr und wenn meine Familie regelm. morgens im dunklen Haus steht, geht einem das auf die Nerven und die Akzeptanz für ein “SmartHome” sinkt…
Ich habe mir ein neues PCIe Board bestellt, weil hier ein Defekt für mich noch logisch klingen könnte: Kein Kontakt zur SSD = Totalausfall
Was ist eure Meinung?
Ich freue mich über jeden Tipp, den ich noch ausprobieren könnte.