Konsole ständig I/O Error auf HP EliteDesk 800 G2

Hey, ich habe seit ca. 2 Wochen doch ständig Probleme mit meinem HA. Vorher lief alles reibungslos und stabil. Es fing an mit unbestimmten einfrieren von HA. Ist dann nicht mehr erreichbar, weder über die URL noch SSH, ließ sich nicht mal mehr anpingen. Nur ein Neustart hilft, danach lief es dann erstmal wieder auf unbestimmte Zeit.

Dann habe ich die Konsole beobachtet und festgestellt, es werden viele I/O Errors geschmissen. Laut Recherche ist ein defekt der SSD nicht auszuschließen. Ok heute dann eine neue SSD eingebaut, HA neu installiert und dann das Backup eingespielt, jetzt nach kurzer Zeit schmeißt die Konsole wieder I/O Fehler obwohl es eine neue SSD ist? Jemand eine Idee was das Problem sein könnte?

Was ich schon versucht habe:
Im Bios alle Powermanagement Settings deaktivert

Hardware:
MiniPC: HP EliteDesk G2
SSD: SATA Sandisk Plus 512GB (vorher war eine Patriot NVME M.2 verbaut)

➜  ~ dmesg | grep sda

[    0.662951] sd 0:0:0:0: [sda] 976773168 512-byte logical blocks: (500 GB/466 GiB)
[    0.663045] sd 0:0:0:0: [sda] Write Protect is off
[    0.664512] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[    0.664577] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[    0.666268] sd 0:0:0:0: [sda] Preferred minimum I/O size 512 bytes
[    0.680579]  sda: sda1 sda2 sda3 sda4 sda5 sda6 sda7 sda8
[    0.683309] sd 0:0:0:0: [sda] Attached SCSI disk
[    1.936655] erofs: (device sda3): mounted with root inode @ nid 37.
[    2.996088] EXT4-fs (sda7): mounted filesystem 5860c7a7-dded-41a3-ac9b-277958a67c3c r/w with ordered data mode. Quota mode: none.
[    3.601209] EXT4-fs (sda8): mounted filesystem 339ecf09-c353-4c21-90da-206c7f6dc951 r/w with ordered data mode. Quota mode: none.
[    3.647933] EXT4-fs (sda8): resizing filesystem from 121918209 to 121918209 blocks
[  426.890609] sd 0:0:0:0: [sda] tag#6 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  426.890613] sd 0:0:0:0: [sda] tag#6 Sense Key : Illegal Request [current]
[  426.890616] sd 0:0:0:0: [sda] tag#6 Add. Sense: Unaligned write command
[  426.890618] sd 0:0:0:0: [sda] tag#6 CDB: Read(10) 28 00 03 a1 7a b0 00 00 08 00
[  426.890620] I/O error, dev sda, sector 60914352 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
[  492.909667] sd 0:0:0:0: [sda] tag#5 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  492.909679] sd 0:0:0:0: [sda] tag#5 Sense Key : Illegal Request [current]
[  492.909686] sd 0:0:0:0: [sda] tag#5 Add. Sense: Unaligned write command
[  492.909693] sd 0:0:0:0: [sda] tag#5 CDB: Read(10) 28 00 03 51 0c 20 00 00 08 00
[  492.909698] I/O error, dev sda, sector 55643168 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
[  555.918275] sd 0:0:0:0: [sda] tag#21 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  555.918281] sd 0:0:0:0: [sda] tag#21 Sense Key : Illegal Request [current]
[  555.918286] sd 0:0:0:0: [sda] tag#21 Add. Sense: Unaligned write command
[  555.918291] sd 0:0:0:0: [sda] tag#21 CDB: Read(10) 28 00 03 51 22 10 00 00 08 00
[  555.918294] I/O error, dev sda, sector 55648784 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
[  576.184524] sd 0:0:0:0: [sda] tag#30 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  576.184534] sd 0:0:0:0: [sda] tag#30 Sense Key : Illegal Request [current]
[  576.184540] sd 0:0:0:0: [sda] tag#30 Add. Sense: Unaligned write command
[  576.184547] sd 0:0:0:0: [sda] tag#30 CDB: Read(10) 28 00 03 93 20 88 00 00 08 00
[  576.184552] I/O error, dev sda, sector 59973768 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0

Ist evtl. ein Lüfter ausgefallen und die SSD wird gegrillt?
So ein 800 G2 ist zwar vollkommen ausreichend aber auch schon etwas in die Jahre gekommen. Wer weiß wie der im vorherigen Leben gequält wurde.

Hey, ja gute idee. Gerade mal Gehäuse Deckel abgenommen. Lüfter läuft, Gehäuse habe ich beim Tausch der SSD noch vorsichtig ausgeblasen.

Habe ja auch extra eine SATA SSD geholt und auszuschließen das der M.2 Port Probleme macht.

Moin,

um weitere Informationen zu bekommen, würde ich mir mal zu den Error Meldungen den tatsächlichen Zeitstempel ausgeben lassen und dann auch in den Logs vom Betriebssystem, schauen

# dmesg -T | grep -i sda
  • Ist das HAOS native, oder via Proxmox, Unraid?
  • Hast Du ein aktuelles BIOS?

Den PC mal von einem USB-Stick booten, dann die SSD, M.2 checken, siehe

Dateisystem analysieren - tune2fs

Mit dem Kommando tune2fs zeigen Sie Parameter des Dateisystems an (vollständige Beispielausgabe):

tune2fs -l /dev/vg00/ext4fs

Dateisystemcheck - e2fsck

Einen Dateisystemcheck führen Sie mit dem e2fsck Kommando aus, ggf. mit dem Parameter -f (vollständige Beispielausgabe):

e2fsck /dev/vg00/ext4fs

Auch mal die S.M.A.R.T daten der SSD, M.2 ermitteln

VG
Bernd

P.S.:

trotzdem mal die Temperaturen der SSD und der M.2 mit sensors auslesen, wenn die Kiste mal etwas gelaufen ist.

1 „Gefällt mir“

@dp20eic schon mal ein paar Antworten auf deine Fragen:

HA is native installiert also als Generic x86-64, mit der neuen SSD via Ubuntu USB dann auf der SSD über DISK in Ubuntu restored, wie es in der Beschreibung steht. Booten lassen und dann direkt die Wiederherstellung aus dem Backup von heute gemacht. Hat auch sauber alles gebootet, nach kurzer Zeit spammt er die Konsole mit dem Fehler zu, muss aber sagen, dass ich sehr lange keinen Monitor direkt an dem MiniPC angeschlossen hatte. Gehe sonst halt immer über SSH o.ä.

Mit Ubuntu booten muss ich noch mal machen. Habe gerade die SSD noch mal rausgenommen und auf meinem Windows PC checken lassen. Zumindest die Tools sagen, es ist alles Ok. CPU Temps waren nie über 55 Grad

Die M.2 SSD ist aktuell ausgebaut.


Moin,

ist jetzt vielleicht etwas weit hergeholt, aber es kann gut sein, dass Du durch das zurückspielen eines Backups ein fehler der vorher da war auch wieder ins neue System kommt.

Ist mir ja bewusst, dass das mühselig ist, aber kannst Du mal ein nacktes, neu installiertes HAOS eine Zeitlang laufen lassen und schauen ob damit auch die i/O Fehler kommen?

VG
Bernd

Weiß nicht ob ich das jetzt über Ubuntu alles richtig gemacht habe, sieht aber soweit gut aus würde ich sagen?

Puh, neu installieren wäre schon ein Mega Aufwand für mich. Habe allein 47 Zigbee Geräte, ESPHome und an die 40 Integrationen laufen.

Ich versuche noch mal ein anderes Backup von heute zu restoren!


Also alles noch mal von vorn installiert:

  1. Ubuntu Live USB
  2. Generic x86 Image runtergeladen
  3. Über DISK HS Image restored
  4. Neustart
  5. Noch im Assistenten kommen wieder Fehler in der Konsole!?

:crayon:by HarryP: Zusammenführung Doppelpost (bei Änderungen oder hinzufügen von Inhalten bitte die „Bearbeitungsfunktion“ anstatt „Antworten“ zu nutzen)

Steck die SSD doch mit einem USB-Adapter an einen PC und schau wie die sich da verhält und wieder Fehler macht.
Dann wäre es eher der Controller im HP G2.

1 „Gefällt mir“

Danke für die gute Idee:
So die neue SATA SSD nochmal restored und per SATA/USB Adapter an den HP G2 angeschlossen, keine Fehlermeldungen mehr bisher.

Also ist wohl der Controller hinüber? Mmh muss ich mir evtl. einen neuen NUC kaufen. :face_with_spiral_eyes: Hat mir heute jetzt 5 Std. lang den letzten Nerv geraubt. Kann ich natürlich lange rumprobieren.

Sonst dauerhaft via USB betreiben? Hat das schon mal jemand gemacht?

Moin,

nop, so meinte ich das nicht, einfach nur Installieren und vielleicht nur ein paar Integration einbinden, die nicht weh tun, dann laufen lassen, um zu schauen, ob der Fehler auftritt.

Sollte das der Fall sein, dann ist es schon mal kein Problem mit Deinem Backup, dann ist da vielleicht auch etwas mit einer HA Version oder HA OS Version falsch, evtl. auch mal bei Home Assistant auf Github nach dem Fehler suchen.

Wenn der Fehler nicht auftaucht, dann ist der Fehler in Deiner Installation vergraben und er kommt immer wieder mit dem Backup herein.

VG
Bernd

Jo danke, habe ich ja schon ohne Erfolg probiert, siehe oben. Kam ja schon nach neuinstallation bevor der Assistant im Browser verfügbar war in der Konsole wieder Fehler

Via SATA/USB Adapter läuft es bis jetzt ohne einen Fehler

Bei mir an einem RPi4 ist die SSD auch per USB angebunden. Nur wenn man schon ein Gehäuse hat sollte man die Platte eigentlich auch einbauen. Ist schon etwas eleganter als es rumliegen zu haben wie bei mir.
Muss doch nicht gleich ein NUC sein. Vielleicht ein G4. So einer liegt bei mir schon rum und wartet auf seinen Einsatz. Aber im Moment tut mir der RPi (zum Glück!!!) nicht den Gefallen und raucht ab.

1 „Gefällt mir“

Ich lasse es jetzt erstmal eine Zeit über USB laufen und beobachte es weiter, bevor ich Geld für was neues rausschmeiße :sweat_smile:

Danke für die Unterstützung :+1: