Hohe Temperatur RasPi 4

Hallo zusammen, ich betreibe HA auf einem Raspi 4 unter Nutzung von HAOS.
Ab und an kommt mein Raspi kurzzeitig auf eine Prozessor-Temperatur von knapp über 80 Grad.
In der überwiegenden Zeit bewegt sich die Temperatur zwischen 55 und 60 Grad.
Einen aktiven Lüfter habe ich nicht, lediglich passive Kühlkörper sind vorhanden.
Gibt es eine Möglichkeit festzustellen, was die hohe Systemlast auslöst?

Falls sich jemand dieses Themas annimmt - ich bin leider nicht so versiert, hinter die “Fassade” von HA zu gucken.
Erklärungen oder Anforderung von weiteren Infos bitte so, dass es auch ein einfacher Enduser wie ich verstehen kann.

Vielen Dank im Voraus.

VG Peter

Ich habe damals GLANCES installiert und schnell einen Fehler gefunden. In GLANCES kannst Du sehr schön sehen, was Deinen Prozessor / Speicher etc. belastet.

GLANCES findest Du unter den Add-Ons.

Hier mal ein Ausschnitt…

Passive Kühlung über die Standard Kühlkörper und in ein 08/15 Gehäuse?
Da darfst Du keine Wunder erwarten. In der Regel sollte die Temperatur bei 40-50 Grad liegen und sollte auf Dauer 80 grad nicht überschreiten. Bei 80 Grad fängt der CPU die Drosselung an.

Typischerweise fordert z.B. ein Backup die CPU oder auch das Kommplieren von ESPHome.
Liegen die Kühlkörper satt auf der CPU mit einer Wärmeleitpaste auf? Ist für ausreichend Belüftung gesorgt?

Gruß Osorkon

Glances habe ich installiert. Da sehe ich aber “nur” die aktuelle Situation, oder kann man auch eine Protokollierung einstellen?

Ja, alles mit Standardkomponenten realisiert. Die 80 Grad werden nur selten erreicht.

Ich wüßte halt gern mal, was die Lastspitzen verursacht. Die Backups sind es nicht, die laufen morgens zwischen 4 und 6 Uhr (systemoptimiert ist eingestellt). ESP Home habe ich nicht im Einsatz.

Moin,

genau, glances ist ein Tool, das Dir nur den aktuellen Staus zeigt,

ja, das geht, aber eben nicht so einfach, dazu müssen einige Voraussetzungen geschaffen sein,

  1. eine influxDB muss eingerichtet sein, bin mir nicht sicher ob V 1.8 reicht oder V 2.x :thinking:
  2. in der Konfiguration vom Add-on muss die influxDB angegeben werden, dann schickt glances da kontinuierlich Daten hin.
  3. Grafana, zum auswerten.

Glances

Grafana

VG
Bernd

P.S.: Temperatur ist aber nicht Bestandteil der Glances Daten

Vielleicht hilft dir das weiter.

Ich hatte auch mal das Problem, dass mein HA-Rechner zu warm wurde.

Ich habe eine Automation erstellt, die mir eine Meldung auf mein Handy geschickt hat. Als Trigger hatte ich die Prozessortemperatur genommen (bei mir war das >50°).

Wenn die Meldung kam, habe ich Glances aufgemacht und “live” gesehen welcher Prozess gerade schwer gewerkelt hat.

Man kann auch mal die Protokolle durchsuchen welche Integration viele Fehler meldet, das kann auch ein Hinweis sein.

Viel Erfolg bei der Suche.

Danke für den Tip. Habe mal ein wenig gegoogelt, das sieht ja nach einer umfangreicheren Aktion aus. Werde ich mir aber mal anschauen.

Die Idee gefällt mir und ist leicht umzusetzen. Das werde ich mal versuchen. Danke.

Habe zufällig eben einen 80-Grad-Moment live beobachtet. Glances sagt folgendes

Welche Erkenntnisse kann ich daraus ableiten? Außer einer hohen Prozessorauslastung
(> 300%?) durch homeassistant?

Das ist natürlich doof und hilft wohl nicht weiter.

Bei mir war es MQTT was über 100% gelaufen war. Konnte also in Richtung MQTT gucken und habe den Fehler gefunden.

Bleibt nur noch der Blick in die Protokolle, ob da auffällig viele Fehler auftauchen.

Auch da werde ich nicht wirklich fündig, sieht für mich eher unauffällig aus

Was auffällig ist: Bisher hatte ich nur relativ kurze Temperaturspitzen. Heute hat sich dieser Zustand schon vor 90 Minuten eingestellt und hält nach wie vor an.

Ich meinte ALLE Protokolle. Auch diese hier:

Offensichtlich “kämpft” HA mit etwas, aber was?

Du solltest doch mehr als die 3 Einträge im Protokoll haben….

Die Temp ist absolut okay.

Kann ich die Logfiles hier irgendwie einfügen/anhängen? Oder kann ich die nur als screenshot hochladen?

Moin,

erst einmal das machen was da steht
grafik
Einfach mal z drücken, dann werden dir da auch alle Prozesse angezeigt :wink:
Siehe bei mir

Dann muss man sich die Architektur moderner CPUs vor Augen führen, ein mal etwas Computergeschichte.

Am Anfang gab es nur die CPU, z. B. 8086, 386, 486 usw. diese CPU war auch gleichzeitig der einzige Rechenknecht, wollte man damit ein Mehrkernsystem aufbauen, brauchte man mehrere CPU Sockel, um mehrere CPU stecken zu können.
Dann gab es CPUs, die zwei Threads gleichzeitig verarbeiten konnten, in Software, das Hyperthreading, als weiter nur eine CPU aber zwei Threads, also entweder kann man sagen CPU = 100 %, aber jeder Thread = 50 % x 2 :wink:

Dann kamen die CPUs, die das nicht mehr in Software machen, sondern in Hardware, es ist weiter nur eine CPU, aber eben mit 4, 6, 8, 10, 12, 96 Kernen.
Man kann jetzt wieder sagen, die CPU selbst = 100 %, dann eben geteilt durch die Anzahl der Kerne, das ergibt aber echt unschöne Werte, daher wird jedem Kern = 100 % zugeordnet, somit hat ein RasPI mit 4 Kernen halt rechnerisch 400 %.
Wenn du jetzt bei dir ~300 & siehst, weißt du, dass 3 Kerne unter Last sind, also ausgelastet sind, somit auch die Temperatur steigt, damit wiederum der Takt der Kerne herabgesetzt wird und somit die Zeit zum Verarbeiten des Befehls steigt.

Du siehst aber erst, wenn du z gedrückt hast, welcher Prozess da genau die Last verursacht.

VG
Bernd

@dp20eic - danke für die Erläuterungen.
Zwischenzeitlich ist die Temp auf ca. 60 Grad gesunken, Prozessorlast aktuell bei 13%.
Wenn ich den nächsten “Temperaturanfall :)” mitbekomme, weiß ich ja, was zu tun ist.

Nochmal Frage in die Runde: Kann ich die Protokolle hier irgendwie anhängen oder nur als screens einbinden?

Mit cut & paste zwischen die </> (siehe oben im Editor) kopieren.

Moin,

die Moderatoren, Admins, haben sich echt Mühe gegeben, alles zu beschreiben, also sollte man das auch würdigen und sich einmal die Anleitung anschauen und durchlesen

Unter dem Abschnitt Code-Snippets findes Du dann auch die Anleitung wie man hier Code, Logs, Meldungen postet :wink:

VG
Bernd

@Peter1
:crayon:by HarryP: Wie man Code-/Logzeilen richtig einbindet, findest Du auch hier:
s.a.: (Neues Update & Features - Hier in der Community 🫶)