Zigbee2mqtt: Plötzlich alle Geräte offline

Ich war im urlaub und als ich wiederkam waren alle z2m Geräte offline. Der übliche Neustart hat diesmal nicht funktioniert. Z2m war wie eingefroren. Auch geräte die online angezeigt wurden (Fenstersensoren) waren offline und statusänderungen wurden nicht mehr erkannt. Fehler war (…Buffer full)
Darauf hin habe ich erstmal die zuletzt hinzugefügten Geräte entfernt ohne erfolg. Gleiche Fehlermeldung.
Dann habe ich das gesamte system (Proxmox) wie zwischendurch immer wieder mal, neugestartet und die Felermeldung wurde zu (no route found)
Während der ganzen Zeit hat sich die Anzeige in den dashboards von z2m und HA nicht verändert.
Dann habe ich versucht die Geräte neu anzulernen, was zwar eine erfolgsmeldung gab aber keine änderung brachte.
Im letzten Schritt hahbe ich nun z2m vollständig gelöscht, um festzustellen, dass nun beim versuch zu pairen die Meldung kommt: failed: Error: Interview failed because can not get node descriptor
Aktuell stehe ich also ohne Zigbeenetzwerk da und muss alle schalter per Hand bedienen, was zum Glück auch noch geht.

Hat jemand einen Tipp?
Noch als Hinweis: Meine Probleme mit Zigbee fingen mit dem Update auf 2.0.0 an und steigerten sich von performance Problemen bis hin zum völligen Ausfall.

Eine Anleitung wie ich die letzte Version vor 2.0 installieren kann wäre also auch sehr hilfreich.
Mit 2.0 habe ich den Adapter auf Sonoff Dongle-P aktualisiert, da mein vorheriger Stick kein Firmwareupdate mehr bekam.

Ich bin völlig ratlos…

Moin,

nicht wirklich, da keine aussagekräftigen Logs vorhanden sind, aber ich entnehme dem geschriebenen, dass Du Z2M als Add-on in HA laufen hast, HA wiederum als VM in Proxmox, soweit korrekt?

Ich würde Dir mal raten, dass Du Dir einen LX Container für MQTT (Mosquitto, oder EMQX) anlegst, dann einen zweiten LX Container für Z2M, beides lässt sich recht schnell und unkompliziert durch die Proxmox Helferskripte bewerkstelligen, siehe

Dann in HA MQTT und Z2M deaktivieren, und die neuen aktivieren, dann LXC-Z2M konfigurieren und mal ein Gerät resetten und neu anlernen.

Wenn das dann klappt, dann alles anlernen und in HA nur noch die MQTT Integration mit dem MQTT Broker verbinden und alles sollte wieder vorhanden sein, wenn Du die Geräte gleich benennst, dann sollte sich in HA auch nichts ändern.

Man kann zwar auch die Z2M Datenbank (das File mit den Informationen) kopieren, da ich den Zustand aber nicht kenne, würde ich alles neu anlernen, tut zwar etwas weh, aber durch Schmerzen lernt man ja bekanntlich am meisten :wink:

VG
Bernd

P.S.: ansonsten ein Backup von vor dem Urlaub einspielen, vielleicht nur MQTT und Z2M und hoffen, dass dann alles wieder geht.

Was sagt denn das Protokoll von z2m?
Hast du alle Änderungen vorgenommen, die für v2.0.0 erforderlich sind/waren?

Schon mal nachgeschaut ob der Dongle-P unter Proxmox noch an die HA VM durchgereicht wird und dann unter HA bei der Hardware auch vorhanden ist?

BTW: Einen USB-Dongle immer mit einem zusätzlichen USB-Kabel anschließen und wenn möglich auch einen USB 2.0 Port verwenden.

Die alte Version wird nicht mehr gepflegt und somit wäre das auf lange Sicht keine gute Entscheidung.

Bei dem Dongle-P solltest Du auch immer die div. Firmware-Diskussionen bei Z2M verfolgen. Da gibt es nämlich ganz unterschiedliche Erfahrungswerte und ggf. Probleme mit den unterschiedlichen Firmware-Versionen.

VG JIm

Erstmal Danke an alle für die Antworten:

Aktuell ist z2m und mosquito aktiv und ohne Fehlermeldungen. Allerdings ist es auch eine komplett neue Installation. Die Geräte anlernen klappt aber auch nicht mehr. Mit der besagten letzten Fehlermeldung.

Außer alles in eigene VM zu stecken, was ich nicht will, habe ich schon alles probiert. Ich werde mir nun mal den SLZB und den Dongle-E bestellen.
Aber mir wäre es am liebsten wieder zu meinem alten Stick und der 1.4 Version zurück zu gehen. Da hatte ich nicht einen einzigen Ausfall oder Ähnliches und alles lief stabil. Danach nur noch Katastrophe. Never Touch a Running System.
Ein Backup mit der alten Version habe ich leider nicht mehr.

Moin,

Das ist leider in der IT-Welt ein Irrglaube und lasse ich ungern unkommentiert, oder würdest Du heute noch ein Win 3.11 benutzen?
Das Verhältnis von, es gibt Probleme mit Version 2.x und alles läuft bestens, sehe ich definitiv zu Gunsten, alles läuft bestens.

Wieso VM, das kann man alles in kleine LX Container verpacken, die nicht mehr Speicher und CPU verbrauchen, als wenn man sie als Add-on in HA betreibt. Ich hatte ja oben schon auf die Helferskripte verwiesen, damit ist in weniger als 5 Minuten MQTT und Z2M aufgesetzt.
Und als Gegencheck zur Add-on-Variante auch bestens geeignet, also Add-ons deaktivieren, und als LXC einrichten, dann mal schauen was passiert.

VG
Bernd

Ich bin gerade dabei mir die aktuellen Z2M Issues Meldungen durchzuschauen, weil ich überlege ob ich jetzt die Z2M Version 2.3.x installiere oder besser noch weiter abwarte. :slightly_smiling_face: Dabei bin ich dann auch über eine Issues Meldung gestolpert in der Koenkk etwas zu der Buffer full Meldung gepostet hat:

The BUFFER_FULL error is quite common with 20240710, try out 20250321

Da Du ja auch einen Dongle mit CC2652 hast wäre ein Firmware-Update auf die Version 20250321 ja auch noch ein Lösungsansatz, sofern Du diese Version noch nicht auf dem Dongle-P installiert hast.

VG Jim

danke für die vielen Tipps.

Outsourcing in eigene Container kommt für mich nicht in Frage, weil ich beim Fernzugriff alles in HA machen will.

Nun aber zu meiner Lösung:
Bei mir half am Ende das Umstellen von usb-by-id auf den USB-Port selbst in der Z2M config

Keine Ahnung warum er usb-by-id nicht mehr wollte oder ob es a den zig anderen Versuchen inkl. Stick austauschen und wieder zurücktauschen lag. Aber Jetzt lauft alles wieder seit gut 7 Tagen absolut stabil.