Nach langem stillen mitlesen habe ich mich nur mit einem Problem hier angemeldet.
Ich habe einen SLZB-06 mit Zigbee2MQTT aus eine Pi 4 mit 8GB Ram laufen. Letzten Abend reagieren Teile meines Zigbee Netzwerkes garnicht mehr oder nur sehr träge. Habe nichts neues installiert oder geupdatet vorher. Kam aus dem nichts.
Was habe ich schon gemacht:
HA und SLZB neustart
Updates auf HA und SLZB installiert
Backup von letzter Woche eingespielt
Bekomme immer wieder die gleichen Probleme. Könnt ihr mir bei der Fehlersuche behiflich sein?
Nachdem Du jetzt das schon gemacht hast wird es natürlich schwierig(er) jetzt noch dazu etwas Konkretes zu sagen, eben weil jetzt die Ausgangslage ja schon wieder eine andere ist.
Erst einmal wäre zu klären ob in den div. HA Protokollen irgendwelchen Warn- oder Fehlermeldungen auftauchen. Auch solche die scheinbar gar nichts mit Zigbee zu tun haben.
Dann wäre die Frage was Dir bei der Z2M Karte so an Verbindungen und LQI-Werte angezeigt werden und ob Du dabei ggf. irgendwelche Veränderungen erkennen kannst gegenüber früher? Und wenn wir schon mal dabei sind: Wie sieht Dein Zigbee Mesh denn überhaupt so aus, sprich über wie viele und welche Geräte reden wir hier?
Ja mag sein, dass es jetzt eine andere Situation ist, aber eigenlcih auch die gleiche wie vorher.
bei Zigbee2MQTT kommen immer die Logs: z2m: Publish 'set' 'state' to 'RGBW_LED_BU_Vitrine' failed: 'Error: ZCL command 0x00158d00068a9eb9/1 genOnOff.off({}, {"timeout":10000,"disableResponse":false,"disableRecovery":false,"disableDefaultResponse":false,"direction":0,"reservedBits":0,"writeUndiv":false}) failed (Timeout - 30608 - 1 - 134 - 6 - 11 after 10000ms)'
HA hat keine Logs zu dem Problem.
Die Linkqualitäten habe ich leider die alten nicht im Kopf, aber aktuell von 30-190 alles dabei. Sehe da auch nichts, RGBW streifen mit LQI 100 reagiert nicht und ein Bewegungsmelder mit LQI 30 reagiert ohne Probleme.
Wir reden über 60 Zigbee Geräte, wovon ca 20-25 stromgebundene Geräte sind.
hier absichtlich erwähnt, weil auch noch viele andere unter HA laufende Dinge den Betrieb von HA natürlich beeinflussen können und das wiederum kann sich auch auf den Betrieb von Z2M auswirken. Inbesondere wenn es darum geht das Z2M ggf.
reagiert.
Das die Z2M Karte nicht unbedingt die Realität (korrekt) widerspiegelt ist ja bekannt, sowohl was die Routen als auch die LQI-Werte betrifft, aber trotzdem kann man die Karte für das ein oder andere durchaus gebrauchen. Z.B. dafür wie sich irgendwelche Änderungen bei Geräten - z.B. nach einem Standortwechsel des Gerätes - ggf. auf das Mesh und die Routen auswirken.
Bei Dir sehe ich im Mesh im Moment 12 Geräte die entweder gar keine, ohne eine Verbindung mit 0 LQI haben und das ist bei 60 Zigbee Geräten in Summe schon eher ungewöhnlich. D.h. da liegt irgendetwas im Argen und ob die Geräte dann trotzdem reagieren oder nicht spielt nicht wirklich eine Rolle. Nach einem HA und SLZB-06 reboot und nachdem man Z2M ein wenig Zeit (bis zu einige Stunden) gegeben hat die Routen wieder zu finden und aufzubauen, sollten in der Z2M Karte nicht mehr so viele Geräte ohne Routen oder mit einer 0 LQI Route vorhanden sein.
Jetzt kommen wir zu dem Punkt:
Das sagen sie alle. Nein mal im Ernst. Wenn Du jetzt also alle Updates installiert hast solltest Du folgende Software-Stände haben:
HA:
Core 2025.4.1
Supervisor 2025.04.0
Operating System 15.1
Frontend 20250404.0
Z2M: 2.2.1.x
Welche Radio und Core Versionen verwendest Du denn aktuelle bei dem SLZB-06? Bei mir:
Weil es ja auch durchaus Versionen gab und gibt die Probleme gemacht haben oder machen.
Klaro, dass es auch mit Änderungen an HA zu tun haben könnte, aber ich habe mit dem updaten erst nach den Problemen angefangen. Ich habe wirklich nicht gemacht
Ja sehe ich auch mit den 0 und einige die kein Verbindung habe, aber funktionieren. Denke die Anzeige istnhier auch nicht ganz korrekt. Muss aber sagen die Batteriebetriebenen Geräte funktionieren alle sowei, meist meine RGBW Stripes und 1-2 Zwischenstecker machen Probleme.
Genau das habe ich auch, außer Frontend/Core ist höher, da heute installiert
Core 2025.4.2
Supervisor 2025.04.0
Operating System 15.1
Frontend 20250411.0
SLZB-06 hat alles die neuste, aber habe zwischendurch auch ältere installiert gehabt.:
Bin halt im Moment etwas ratlos, wo ich noch suchen und /oder testen kann. Ich weiß noch nichtmal ob es an HA selber liegt oder vielleicht an dem SLZB-06.
Tja es ist natürlich schwer aus der Ferne dazu etwas zu sagen, inbesondere - wie schon erwähnt - weil man ja auch nicht die Situation und Ausgangslage kennt als die Probleme angefangen haben. Das Du dann schon ein paar Dinge probiert hast um das Problem ggf. zu lösen ist klar und verständlich, aber da das bisher ja nicht zum Erfolg geführt hat sieht es eher danach aus als wenn Du da ggf. ein ganz anderes Problem hast. Welches auch immer das genau sein mag. Daher ja auch meine Frage zu dem sonstigen HA Protokollen.
Mit der aktuellen HA und auch Z2M Version sind mir zumindest keine grundlegenden Problem in der Art wie Du sie aktuell hast bekannt. Mit verschiedenen Radio und Core Versionen des SLZB-06 sind ja durchaus unterschiedliche Probleme bekannt und hier im Forum ja auch immer mal wieder erwähnt worden, aber diese Probleme betrafen dann halt nur bestimmte Versionen und konnten durch ein Firmware Up- oder ggf. auch Downgrade gelöst werden. Zu der aktuellsten Radio- und Core-Firmware kann ich leider gar nichts sagen.
D.h. im Moment kann und müsste ich da auch im Nebel stochern und das bringt Dir auch nichts. Wenn Dir sonst keine Dinge einfallen die vielleicht als Ursache in Frage kommen - z.B. weil Du irgendetwas bei Dir im WLAN geändert haben solltest (Stickwort: Zigbee und WLAN Kanäle) - hilft da wohl nur weitersuchen und alle möglichen Dinge mit irgendwelchen HA Backups ausprobieren. Ggf. kannst Du ja auch einfach mal die Radio und Core Firmware auf dem SLZB-06 installieren die ich hier nutze. Die mache bei mir halt Null Probleme. Ansonsten habe ich leider auch keinen anderen Rat oder gar einfach Lösung für Dich.
BTW: Denk auch daran das Du nach Änderungen bei Z2M oder dem SLZB-06 am besten HA immer kompl. neu bootest und nicht nur einen einfachen HA Neustart machst. Außerdem braucht - wie schon erwähnt - ein Zigbee Mesh immer erst einige Zeit bis sich Routen wieder (stabil) aufgebaut haben.
nenn einmal deren Namen, bzw. verweis da mal auf die Z2M Datenbank.
Ich habe, obwohl meine Installation evtl. von Deiner abweicht, aktuell keine Probleme, nur bei mir läuft alles auf Proxmox, schön mit einzelnen Diensten, also Z2M, MQTT-Broker, schön separat in eigenen LX Containern, und ich setze ein Zigbee TI Entwicklerboard ein.
Geht es den RasPI 4 Ressourcen soweit gut?
Hast Du glances installiert, sieht man da etwas Auffälliges?
Die betroffenen, mal stromlos gemacht, gewartet und wieder ans Stromnetz angeschlossen?
Jim_OS JA danke aber füpr deine Hilfe bis hierhin. Soweit hane ich auch alle Ratschläge schon hier und wo ich anders gelesen habe schon soweit umgesetzt. Lasse das System für heute auch mal in Ruhe, mal segen wie es morgen aussieht.
dp20eic Raspie läuft ohne Probleme CPU immer unter 10%, Ram 1,4 von 8 und Festplattenspeicher über 100GB frei.
Glances? was ist das? Ein Überprüfungstool? Stromlos war auch alles, habe sogar eine zweit Pi4 aufgesetzt und da ein update eingespielt, gleiches Ergebniss.
OK wenn es in den HA Protokollen keinerlei Hinweise auf etwas gibt was sich irgendwie auf das gesamt HA-System und somit ggf. auch auf Z2M auswirken könnte (Stichwort: Auslastung) und Du auch - wie bereits erwähnt - irgendwelche Veränderungen bei Deinem WLAN ausschließen kannst (Stichwort: Kanäle), dann bleibt nur noch Z2M selber als möglicher Verursacher über. D.h. entweder die Z2M Version, der SLZB-06, oder einzelne Zigbee Geräte.
Bei Z2M wirst Du ja vermutlich auch die aktuell Version benuzten und dazu sind mir keine Probleme bekannt die als mögliche Ursache für Deine Probleme in Frage kommen.
Bei dem SLZB-06 hatte ich das Thema Firmware-Versionen ja schon erwähnt und zumindest bei den Versionen die ich hier nutze sind mir auch keine Probleme bekannt die als mögliche Ursache für Deine Probleme in Frage kommen. Da ich davon ausgehe das Du den SLZB-06 in letzter Zeit nicht an einen anderen Standort gebracht hast und es auch sonst nichts (Neues) gibt was den irgendwie beeinflussen kann, fällt das also auch aus.
Bleiben noch die ~ 60 Zigbee Geräte im Mesh. Mal unabhängig davon wie exakt die angezeigten Dinge bei der Z2M Karte stimmen oder nicht, aber die Sache mit den 12 Geäten ohne, oder mit einer 0 LQI Wert Verbindung, ist nicht normal. Es ist durchaus und theoretisch denkbar das ein oder mehrere Zigbee Geräte im Mesh - aus was für Gründen auch immer - “herumspinnen” und das Mesh mit so viel Daten fluten das die Kommunikation im Mesh in die Knie geht, oder teilweise ganz abbricht. Die Schwierigkeit dabei ist nur festzustellen ob das ggf. die Ursache sein könnte und wenn ja welches der Geräte im Mesh dafür vielleicht verantwortlich ist.
Das kann man eigentlich nur herausbekommen wenn man das Z2M Log mal auf Info oder gar Debug umstellt,
in der Hoffnung dann irgendwelche Dinge zu Gesicht zu bekommen die ggf. irgendwelche Rückschlüsse zulassen. Wobei die Auswertung dieser Logs dann auch durchaus ziemlich mühsam sein kann.
Die andere Möglichkeit wäre halt alle Zigbee Geräte nacheinander und temporär aus dem Mesh zu entfernen und dann jeweils zu schauen ob und welche Auswirkungen das auf das Mesh hat. Diese Variante ist natürlich entsprechend zeitaufwändig, weil nach dem entfernen von z.B. einem aktiven Gerät (Router), sich Geräte ggf. erst wieder eine andere Route suchen müssen und man abwarten muss bis das passiert ist. Aber es ist durchaus denkbar und auch schon vorgekommen, dass einzelne Zigbee Geräte für solche Probleme wie Du sie schilderst verantwortlich waren. Nachdem man sie aus dem Mesh entfernt hatte funktionierte alles wieder normal.
Ich kenne Deinen Mesh-Aufbau natürlich nicht und bei mir gibt es auch nur 16 Zigbee Plugs die auch Router sind, aber wenn ich so ein Problem wie Du hätte und ich die bereits alle angesprochenen Dinge als Ursache ausschließen könnte, würde ich halt hingehen und nach und nach mal die Plugs temporär entfernen und/oder mal untereinander austauschen und schauen wie sich das Mesh dann verhält. In der Hoffnung vielleicht einen mutmaßlichen “Störenfried” zu finden.
Also mit dem Kanal, habe ich vergesen zu schreiben, habe ich gestern schon geprüft. Zigbee Kanal 11 und Wlan Kanal 6. Habe auch mal mit der Fritz Wlan App geschaut und da ist jetzt auf Zigbee Kanal 11 nur eine schweacher Wlan Kanal 1, aber den gab es schon immer.
Es hat sich auch etwas gebessert das Zigbee Netzwerk, warum auch immer, aber noch nicht ganz das von dem was es vorher mal war. Ich denke auch, dass es ein Geräte im Netzwerk eventuell ist oder der Stick selber. Alle Geräte mit LQI 0 laufen auch über keinen Router , sind alle direkt mit dem SLZB verbunden. Hier mal ein neues Bild, die restlich LQI Werte sind auch jetzt höher
Habe auch mal auf Debug gestellt und eine Überlastung sehe ich jetzt erstmal nicht. Gesendet wird ca. alle 1-3 Sekunden was, also nicht übermäßig viel.Kleine Auszug mal
Wenn ich Geräte aus Zigbee2MQTT lösche, sind die ja weg. So kann ich es ja testen. weil wenn ich sie wieder anlerne und gleich benenne sollte HA ja ohne mucken alles wieder bei alten haben (Automatisierungen, Gruppen, usw.), Korrekt so?
Ohne jetzt auf jedes Gerät einzeln einzugehen, aber ist für diese Geräte dann der SLZB-06 quasi am nähsten dran, oder gibt es ggf. auch noch Router die näher wären und über die sie sich auch verbinden könnten. Weil die Abkürzungen am Ende der Gerätebezeichnung wie z.B. KU, WZ, BA steht ja vermutlich für einzelne Räume wie Küche, Wohnzimmer, Bad usw. Wenn dem so ist wird es in diesen Räumen ja vermutlich auch Router geben und somit wäre es dann auch schon wieder etwas ungewöhnlich wenn sich die Geräte dann nicht über diese Router verbinden, sondern quasi an dem Coordinator “kleben”. Was bei Geräten von einzelnen Herstellern ja auch immer mal wieder der Fall ist. Aqara wäre wohl ein Beispiel dafür. Zumindest liest man das immer mal wieder: Einmal angelernt wird die Route nicht mehr gewechselt.
OK das ist jetzt keine Erklärung dafür warum die Probleme jetzt erst auftauchen, auch wenn Du nach Deiner Aussage ja gar nichts verändert hast, aber für mich sieht es so aus als wenn da einige Geräte durchaus Routen-Probleme haben. Was auch immer jetzt die genaue Ursache dafür ist.
Jepp auch das wäre möglich. Aber auch dann gilt: Nicht nur HA neu starten sondern neu booten.
Jepp. Wobei dieses löschen und wieder neu anlernen auch durchaus eine mühsame und manchmal “zickige” Angelegenheit ist, oder sein kann.
Statt die Geräte bei Z2M zu löschen würde ich - sofern möglich - einfach die Stromversorgung kappen. Also einen Plug einfach mal aus der Steckdose ziehen und ihn dann auch für einen Tag entfernt lassen. Oder wie schon gesagt Geräte untereinander tauschen, sprich einen Birne oder Plug aus dem Wohnzimmer z.B. mal in der Küche anschließen und das Gerät aus der Küche dann im Wohnzimmer. Usw.
Auch die batteriebetriebenen Gerät kann man ja - sofern sie nicht fest montiert sein sollten - mal an andere Standorte bringen, dort die Batterie mal kurz entfernen und sie dann im Anschluss wieder eine dann hoffentlich andere Route suchen und finden lassen. Wenn sie dann an dem neuen Standort keine andere Route finden weiß man schon mal das es sich dann vermutlich um ein “zickiges” Gerät handelt, was einem ggf. Schwierigkeiten bereiten könnte.
All das sind natürlich Dinge die eine Menge Zeit kosten, inbesondere weil es immer erst einige Stunden dauern kann, bis das Zigbee Mesh sich wieder irgendwelche Routen gesucht hat. Aber ich sehe da im Moment leider keine andere Möglichkeit außer solche Tests zu machen, um hoffentlich die/eine Ursache zu finden.
Edit: Poste hier vielleicht auch noch einmal einen Screenshot von der kompl. Z2M Karte. Mich würde nämlich mal interessieren wie viele Endgeräte sich auf der linken Seite mit den Routern verbunden haben. Da müsste es dann ja vermutlich auch noch so 10 - 20 Endgeräte geben die sich über Router verbunden haben.
Nur mal so zum Vergleich: Bei mir ist der SLZB-06 im Flur im Erdgeschoss und bei mir gibt es aktuell a) eh nur wenige Endgeräte und b) sind diese auch alle im Ergeschoss. Aber keins dieser Endgeräte ist mit dem SLZB-06 verbunden, sondern sie nutzen alle irgendwelche Routen über vorhandene Router.
Eben weil es immer einen Plug und somit Router gibt der näher an dem Endgerät dran ist als der SLZB-06.
Edit 2: Für den Screenshot schalte dann auch mal die Ansicht von schwarz auf weiß um,
da zumindest ich die Geräte, Werte und Routen dann besser erkennen kann, als blau oder grün bei schwarzen Hintergrund.
Haha manchmal ist es doch einfacher als gedacht, einfach Stecker ziehen. Bin ich jetzt gar nicht drauf gekommen Fange dann mal an ein paar Geräte zu tauschen und mal ein Geräte was keine Verbindung hat, mal Batterie raus nehmen. mal sehen was passiert.
Hier noch mein kpl. Mesh
OK also noch 25 Endgeräte die sich über Router verbunden haben. Je nachdem an welchem Ort sich Dein SLZB-06 befindet würde ich als erstes mich mal mit den Geräten befassen die dort mit 0-er LQI-Werten auftauchen und die - wenn ich die Gerätebezeichnungen richtig interpretiere - sich auch teilweise in unterschiedlichen Räumen befinden. D.h. da fragt man sich schon warum sich ein Endgerät im Schafzimmer (SZ), in der Küche (KU) und im Wohnzimmer (WZ) mit dem SLZB-06 verbinden und nicht über einen Router in einen dieser Räume. Die Endgerät die kompl. ohne Verbindung angezeigt werden sind dann eine weitere Baustelle.
Ganz zum Schluss gebe es dann noch die Möglichkeit Geräte auch mal neu anzulernen und dabei mal mit den Variante zu spielen, sprich Anlernen aktivieren (Alle) oder eben auch mal das anlernen über einen bestimmten Router. Wobei es dabei leider auch wieder Endgeräte gibt die ggf. “herumzicken” und sich z.B. nur über den Coordinator anlernen lassen.
Wie gesagt sind die Infos die die Z2M Karte anzeigt auch immer mit Vorsicht zu genießen und müssen auch nicht immer der Realität entsprechen, aber man kann die Karte zumindest dafür nutzen irgendwelche von einem selber durchgeführte Änderungen halbwegs verfolgen zu können. Z.B. dadurch das jetzt eine andere Route für ein Gerät angezeigt wird und/oder das sich irgendwelche LQI-Werte ggf. verändert haben.
Viel Erfolg und auch viel Geduld bei der Suche und den Versuchen.
Das siehst du genau richtig, die Geräte sind in unterschiedliechen Räumen, wo eigentlich Meshgerät vorhanden sind. Keine Ahnung warum diese nicht benutzt werden. Wie gesagt, ist ja kein Einzelfall, sondern mehrere Geäte in verschiedenen Räumen.
Ich werde jetzt mit den Positionen mal spielen und dann nächstes Wochenende mal mit dem anlernen an einen Meshgerät mal testen. Hab halt nur am Wochenende immer Zeit dafür.
Obwohl sich mein Netzt immer weiter stabilisiert.
So funktioniert anscheinend alles wieder. Bin einfach mal hin gegangen und alle Geräe die LQI 0 oder keine Verbindung hatten einfach nochmal neu angelernt und schon gingen die einzelnen Geräte wieder und das auch im Mesh.
Ich drücke Dir die Daumen das das auch möglichst lange so bleibt. Auch scheinen sich ja jetzt mind. 3 Geräte, die vorher über den Coordinator verbunden waren, über einen Router verbunden zu haben.
In Zukunft halt mal dann und wann einen Blick auf die Z2M Karte werfen. Dabei dann nicht sofort “irritieren” lassen wenn dort mal ein Gerät ohne eine Verbindung auftaucht und auch nicht direkt von solchen Warn- und Fehlermeldungen im Z2M Protokoll:
[2025-04-14 17:57:06] warning: z2m: Failed to ping 'T_Plug3_Stehlampe' (attempt 1/1, ZCL command 0xa4c138b44650f0dc/1 genBasic.read(["zclVersion"], {"timeout":10000,"disableResponse":false,"disableRecovery":true,"disableDefaultResponse":true,"direction":0,"reservedBits":0,"writeUndiv":false}) failed (Timeout - 26145 - 1 - 14 - 0 - 1 after 10000ms))
[2025-04-14 17:58:22] error: z2m: Failed to read state of 'L_Plug3_Waschmaschine' after reconnect (ZCL command 0xa4c1381e8a65616e/1 genOnOff.read(["onOff"], {"timeout":10000,"disableResponse":false,"disableRecovery":false,"disableDefaultResponse":true,"direction":0,"reservedBits":0,"writeUndiv":false}) failed (Timeout - 27865 - 1 - 45 - 6 - 1 after 10000ms))
So etwas habe ich hier bei mir auch regelmäßig und ich meine das das auch erst seit Z2M 2.0 so ist. Oder zumindest ist es vom Gefühl her seit dem schlimmer geworden. Aber ob dafür bei mir jetzt wirklich Z2M 2.0, oder der SLZB-06 der hier seit ~ 3/4 Jahr im Einsatz ist, oder die zusätzlichen 10 Tuya OEM Zigbee Plugs die in den letzten Monaten so hinzugekommen sind verantwortlich sind: Man weiß es nicht. Wie sagt man so schön: Früher war alles besser.
Ich lasse mich davon schon nicht mehr aus der Ruhe bringen. Wenn man aber - so wie Du vermutlich - viele Automatisierungen mit den Zigbee Geräten umgesetzt hat und darauf vertraut, oder darauf angewiesen ist das diese dann auch zu 100 % funktionieren, ist das natürlich blöd.
Lief ja davor 6 Monate einwandfrei und davor Jahrelang mit einem Sonoff-Stick. Hoffe ist nur einmalig gewesen. Ich mache es meistens so, wenn alles läuft schaue ich erst garnicht in die Logs Werde aber jetzt in nächster Zeit einfach mal mehr auf Zigbee schauen, ob sich da was tut.
Es ist immer blöd, wenn dein Smarthome nicht zu 100% funktioniert. Bei mir sind es dann fast nur komforteinbußen, darauf habe ich schon geachtet, dass auch alles noch “offline” geht.