IO Pressure Stall alle 30 Minuten HaOS in Proxmox

masterpete · 19. März 2026 um 07:56

Moin.

ich war mir über den Bereich nicht sicher. Ich habe ein Phänomen und kann es nicht eingrenzen.

HW: Intel Nuc

Proxmox 9.1.6

Eine Docker VM

eine HaOS VM

nun sehe ich auf der HAOS VM alle 30 min:

der docker hat zu der Zeit auch was aber massiv weniger (in Prozent auf jeden Fall)

der Host macht daraus:

wie kann ich dem Problem auf den Grund gehen. Ich habe auch mal diverse Integrationen, die ich vermutet habe deaktiviert - ohne Erfolg. Im Ha Log steht nichts zu der Zeit . Aktivität hat eine auffällige 10 Minuten Pause:

Kann aber sein, da ich die Aktivitäten in der yaml filtere.

Wo würdet ihr ansetzen. Kann ich irgendwelche Logs auf OS Level machen? Ha, Docker, Host?

Jim_OS · 19. März 2026 um 12:47

Moin

Eine konkrete Ursache zu Deinen Problem kann ich Dir leider auch nicht nennen. Vielleicht auch einfach mal zum Vergleich ein paar Werte von mir hier. Auf meiner Proxmox Kiste

läuft aktuell eine HA VM (2 Core mit 6GB RAM und eine NAS VM (2 Core mit 10GB RAM). Die PSI-Werte sind dabei vollkommen unauffällig.

Host

HA VM

NAS VM

Eigentlich hast Du ja schon Logs in denen Du mal nachschauen kannst. D.h. zuerst würde ich mal im Proxmox System Log schauen ob dort zu dem Zeitpunkt irgendwelche eher ungewöhnliche Dinge auftauchen.

Dann bei HA im Supervisor und Host Protokoll nachschauen ob und was es dort zu dem Zeitpunkt so an Einträgen gibt. Ggf. dann auch mal die dort

vorhandenen anderen Protokolle durchgehen ob es dort zu dem Zeitpunkt ggf. irgendwelche eher ungewöhnlichen Einträge gibt.

Das der PSI-Wert bei der HA VM auf rund 90 % geht spricht natürlich dafür das dann auch irgendetwas unter HA dafür verantwortlich ist, dass aber zeitgleich dann auch der PSI-Wert für die Docker VM hoch geht würde dann irgendwie wieder für Proxmox sprechen. Mir ist aktuell allerdings nichts bekannt was bei PVE 9.1.6 dafür eine mögliche Ursache sein könnte, sprich irgendein Bug bei PVE 9.1.6 oder so. Außerdem könnte es dafür dann auch noch ganz unterschiedliche Gründe haben. Bis hin dazu das Proxmox bestimmte (NVMe)SSD nicht so wirklich zu mögen scheint.

Was ist wenn Du die HA VM mal für ein paar Stunden stoppst? Geht dann der PSI-Wert bei der Docker VM auch noch regelmäßig alle 30 Minuten in die Höhe? Falls ja könntest Du die HA VM und somit HA, als mögliche Ursache ja eigentlich ausschließen.

Das es regelmäßig alle 30 Minuten passiert sprich natürlich für irgendeinen Dienst oder Programm/App was das veranlasst.

Da es den PSI-Wert bei Proxmox auch noch nicht so lange gibt, gibt es dazu vermutlich auch nur eher weniger Erfahrungswerte von Usern zu möglichen Problemen und im Proxmox Forum wirst Du ja sicherlich auch schon danach gesucht haben.

VG Jim

masterpete · 19. März 2026 um 15:29

Danke für die lange Antwort. Das zeitweise stoppen werde ich mal probiere. Gibt es bei HAOS sowas wie htop was man loggen könnte? Die loggst sind alle auffällig. Während des IO STALLS sind auch die WEbseiten nicht erreichbar und Befehle wie Schalter → Zigbee2MQTT reagieren nicht / träge

Jim_OS · 19. März 2026 um 16:19

Könnte man zwar nachinstallieren, aber ich würde da nicht unbedingt Dinge im Root nachinstallieren. Es gibt hier im Forum ja schon so einige Beiträge zu irgendwelchen “Performance-Themen” und darin sind dann auch div. Tools erwähnt - wie z.B. Glance - mit denen man etwas mehr an Infos bekommt.

Beispiel-Beitrag:

Wie gesagt: Das bei zwei VM immer zeitgleich die PSI-Werte in die Höhe gehe finde ich etwas komisch, auch wenn diese Steigerung bei der Docker VM ja nicht der Rede wert ist. Wenn es nur die HA VM betrifft wäre recht klar das Irgendetwas bei HA das Problem ist, aber so wie bei Dir jetzt. Ich selber weiß leider auch zu wenig was das Thema PSI bei Proxmox betrifft, weil ich mich damit noch nicht wirklich tiefergehend beschäftigt habe. Da müssen dann andere Spezies ran.

Das Proxmox Forum hatte ich ja schon erwähnt und auch das Thema SSD. Man findet auch an anderen Stelle etwas zu dem Thema “Probleme” mit PSI und PVE 9.x. Aber ob Irgendetwas davon jetzt auch bei Dir zutrifft: Leider keine Ahnung.

https://www.reddit.com/r/Proxmox/comments/1mkgmlj/io_pressure_stall_on_proxmox_9/
https://www.reddit.com/r/Proxmox/comments/1p0fbm4/high_io_pressure_stall/

VG Jim

zaphood · 19. März 2026 um 18:53

welches konkrete Modell der SSD ist denn da verbaut und welches Dateisystem nutzt du?

masterpete · 19. März 2026 um 22:02

zaphood · 20. März 2026 um 05:55

Was ich befürchtet hatte. Eine EVO Disk UND ZFS, die Kombi ist maximal problematisch.

Die EVOs sind Desktop-SSD mit TLC oder ähnlichen. Die Desktop SSD haben wesentlich kleinere Caches wie zB. die PRO. Server schreiben wesentlich mehr als Desktops das tun. Vor allem bei VMs, Snapshots, Backups, etc. Daraus resultiert bei den Desktop-Modellen ein regelmässiger Cache-Überlauf, die SSD kommt nicht mehr hinterher mit Schreiben. Das ist der Grund für deine IO-Stalls.
Zusatzproblem: Du nutzt ZFS auf einer Consumer SSD. ZFS wird dir die Disk in kurzer Zeit in Grund und Boden geschrieben haben und die ist am Ende.

Meine Empfehlung: Für Server entweder Samsung Pro oder WD Red und für Zuhause LVM / LVM-Thin anstatt ZFS. Für ZFS brauchst du Enterprise SSD, das schreibt noch sehr viel mehr als andere Dateisysteme.

Cu

Frank

masterpete · 20. März 2026 um 06:31

Danke für deine Einschätzung. Ich hatte es damals extra von LVM auf ZFS gewechselt, wegen Replication etc ( was ich leider nicht wirklicht nutze). Der Umstieg zurück würde eine Neuinstallation node für node bedeuten oder?

zaphood · 20. März 2026 um 07:07

Ich verstehe nicht ganz, wohin du replizieren willst? Du hast doch nur einen PVE Host? Snapshots gehen auch mit LVM-Thin. Und der einfachste Weg ist, mounte dir ein Netzwerklaufwerk für Backups (zur Not auch ne USB Disk, falls du kein NAS hast) und sichere alle VMs mit dem eingebauten Backup. Dann setzt du den Proxmox Host auf einer vernünftigen SSD neu auf und importierst die gesicherten VMs vom Backup. Kein Hexenwerk.

masterpete · 20. März 2026 um 07:29

Ah, das habe ich wohl nicht erwähnt, dass ich einen 3 Node Cluster habe. Derzeit aber alles auf einem Node läuft, weil ich Hardware (ZigbeeStick) fest angeschlossen habe.

zaphood · 20. März 2026 um 07:43

Lol, schau an…Kontext hilft. Ok, dann verstehe ich ZFS. Aber dennoch wird das auf Dauer nur stabil laufen, wenn du dir ggf. gebrauchte Enterprise SSD kaufst. ZFS ist hart zu den Disks und selbst die WD Red würde ein recht kurzes Leben haben.

mikedelta · 20. März 2026 um 07:46

Moin! Ich habe auch einen 3 Node Cluster in meinem HomeLab mit aktuell 24 LXC & mehreren VMs am laufen - ich migriere öfters Systeme auf andere Nodes für Updates, Wartung, etc. Als Unterbau nutze ich ZFS auf 250GB/2TB WD Red NAS NVMEs seit ca. einem Jahr und kann die nur empfehlen. Keinerlei Probleme im laufenden Betrieb, Wearout bei den 250GB Modellen bei aktuell 10% und bei den 2TB Modellen bei 1%.

Matt1 · 20. März 2026 um 07:47

Cluster ist deutlich härter zu den SSD als ZFS allein. Ich würde auch nur „Pro“ Modelle nehmen. Aber selbst meine 9100 Pros werden vom Cluster mit Schreibvorgängen echt gefordert… Mit einem Single Mode PVE halten die SSD DEUTLICH länger.

Man kann natürlich das Logging etc im Cluster anpassen, aber da sollte man wissen was man tut und das ist dann out of Support.

Matt1 · 20. März 2026 um 07:49

So unterschiedlich kann es sein. Meine 6x 4TB 9100 Pro haben in 8 Monaten 10% eingebüßt….

masterpete · 20. März 2026 um 08:00

würde es helfen, wenn ich die kisten mal auf die nvme schiebe oder habe ich dann andere probleme?

Matt1 · 20. März 2026 um 08:16

Kann man probieren. Die hat aber auch „schon“ 12% ihrer Lebenszeit verloren

masterpete · 20. März 2026 um 10:44

ne die ssd hat das. nun schiebe ich es auf die 1% nvme.

und zack alles gut

zaphood · 20. März 2026 um 15:12

Ach, dann lagen die VM auf der SSD, nicht auf der EVO? Dann bin ich mal gespannt, ob die nicht auch bald IO Stalls produziert und ich würde mal den Wear im Auge behalten

Die SSD ist ne Crucial, die ist noch mehr Consumer als die EVO.. und ist ggf sogar QLC und nicht nur TLC…

masterpete · 20. März 2026 um 16:46

Danke für die Tips beobachte ich und notfalls geht es halt von ZFS weg.

Thema		Antworten	Aufrufe
Was passiert zwischen 5 und 6 Uhr? Speicherproblem Allgemein	2	89	14. April 2026
Lenovo I3 8GB /512gb ssd & Proxmox mit HAOS friert ein Allgemein	32	262	18. März 2026
Probleme nach Umstellung auf Proxmox Installation, HW & HA-OS proxmox	5	175	26. Dezember 2025
Home Assistent VM unter Proxmox Allgemein	6	138	4. Januar 2026
Proxmox/HAOS: RAM läuft langsam voll und HA reagiert im Frontend nicht mehr Installation, HW & HA-OS	18	337	27. Oktober 2025

IO Pressure Stall alle 30 Minuten HaOS in Proxmox

Verwandte Themen