Proxmox: Seit Update laufen LXC nicht mehr

Hi Leute,

ich habe gestern mein Proxmox upgedatet, waren knapp 25 Pakete, lief auch alles durch sofern ich das erkennen konnte. Danach hab ich ein Reboot gemacht und das System laufen lassen.

Mein Netzwerk sieht grob so aus:

1. 2. 3. 4.
Fritz7590 Proxmox-Server ADGuard (LXC)
WiFi Verbraucher
PC
Netgear-Switch Verbraucher
Fritz7490 (Mesh Repeater) Verbraucher
WiFi Verbraucher

Gestern Abend hatten die Geräte über die 7490, oder eher der eine TV, kein Internet mehr, Netzwerk war aber laut Router i.O… Gab noch ein Update von 7.57 auf 7.59. das hab ich durchgeführt. Danach hatte sich nichts geändert, also hatte ich Promox in Verdacht, allerdings lief über die 7590 alles normal und auf den ersten Blick war in der Proxmox auch ok.

Als LXC habe ich PiHole (deaktiviert) und ADGuard installiert, ADGuard war auch als DNS-Server auf der 7590 eingetragen und filterte bisher fleißig, auch vom Samsung-TV (sehr geschwätzig) über die 7490. Daneben noch ein paar inaktive Container, die ich nicht getestet habe, Octoprint als LXC - läuft einwandfrei und Home Assistant als VM - auch i.O.

ADGuard kann ich nicht mehr per Browser aufrufen und ich meine die Konsole hätte auch nicht reagiert, wird aber mit Hostname und IP im Router angezeigt. Dann wollte ich testweise auf PiHole wechseln, also Adguard heruntergefahren und Pihole mit der gleichen IP hochgefahren, das selbe Problem.

Hatte dann gestern die DNS-Einstellungen der Router wieder zurückgesetzt und wollte es heute wieder testen. Hat sich natürlich nichts geändert, daher hab ich einfach mal einen neuen LXC mit ADGuard und der alten IP aufgesetzt und da komme ich auf die Weboberfläche. Konsole ist auch erreichbar, auf die des alten LXC komme ich jetzt auch, vermutlich habe ich die Eingabeaufforderung unter dem weißen Balken nicht gesehen und wieder umgeschaltet.

Vorher musste ich aber die Container-Templates erneut runterladen, die waren nicht mehr vorhanden und auch (weil) der Speicherort nicht mehr konfiguriert war. Jetzt habe ich die Templates, ein frisches ADGuard und ein nicht erreichbares, ich vermute die LXC hatten keinen Zugriff auf das Template (Debian 12) und haben sich beim Update verabschiedet.

Wäre jetzt kein Problem das frische ADGuard zu nutzen, aber ich weiß nicht mehr wie ich das Teil konfiguriert habe. Weiß jemand wie ich entweder den alten LXC reparieren kann oder wie ich per Konsole an die Konfiguration komme?

Viele Grüße
Jörg

Sind die LXC auf Ubuntu ?

Dann mache mal ein Fallback des Proxmox-Kernel, es scheint damit ein massives Problem zu geben.
Ich hab das Problem auch, die LXC unter Ubuntu sind nach einigen Stunden nicht mehr erreichbar, aber über die Web-Konsole kommt man drauf und die Anwendungen sind online
Der Fallback hat bei mir bei allen LXC geholfen ( bis auf einen )

apt install proxmox-kernel-6.5.13-5-pve
proxmox-boot-tool kernel list
proxmox-boot-tool kernel pin 6.5.13-5-pve
proxmox-boot-tool refresh

( Kleiner Tip - bei solchen Probleme sind die Foren der Software immer die bessere Anlaufstelle, gibt dazu eine Thread im Proxmox-Forum )

Moin,

Nein, der TE schrieb ja,

Und hast Du kein Fehler bekommen?
Ich habe gestern auch geupdatet, bekam aber beim Update aus der WEB-GUI den Fehler, dass er proxmox-pv und noch eins, das mir gerade nicht einfällt, löschen wollte, habe abgebrochen und dann auf der Konsole, dann geupdatet

# apt update
# apt dist-upgrade

Ob das, jetzt das Problem ist, kann ich nicht sagen, ich setzte ADGuard und PIHole nicht ein.

Hast Du Backups?
Wenn der alte LXC noch da ist, kann man doch auf der Konsole nach der Konfiguration suchen, habe wie gesagt keine Ahnung von den Tools, aber meist findet man die Konfiguration ja unter /etc/ oder /var/lib/...

VG
Bernd

Hab ich überlesen, aber Ubuntu basiert auf Debian, wird als vermuttlich auch betroffen sein, Proxmox ist Debian und desen Kernel wird an die LXC durchgereicht, deswegen funktionieren die VM’s auch weiterhin - ist bei mir auch so, beide VM laufen problemlos ( HA und RaspberryMatic )

Du hast ein Update von Proxmox gemacht und damit dir die Problem eingehandelt - dann mache das erst mal rückgängig, bevor du dir einen neuen Fehler einbaust und Sachen reparieren willst, die nicht die Ursache sind.

Schau ob du proxmox kernel neuer als proxmox-kernel-6.5.13-5-pve hast, wenn ja, installieren den proxmox-kernel-6.5.13-5-pve wie ich oben beschrieben habe, reboot die Kiste und schaue dir das dann paar Tage an und keine Updates machen.

Danke euch beiden schon mal.

@Tuxtom007 schaue ich mir morgen noch mal genau an.

Backups habe als Snapshots von allen LXCs und VMs der letzten 10 Tage auf der NAS, nur kein gesamtes Proxmox Backup.

Ich konnte keinen Fehler erkennen, zumindest nicht in der Geschwindigkeit wie das runterläuft.

Moin,

Nein, wenn eine Kernkomponente gelöscht werden soll, bedarf es einer Bestätigung, sprich das Update hält an und zeigt Dir ein Warnhinweis, den man mit J oder N beantworten muss, wenn Du natürlich einfach Enter gedrückt hast, dann war J ausgewählt und es wurde gelöscht.

Was sagt denn der Befehl

# apt list --install proxmox-pv*

VG
Bernd

Da kommt E: Command line option --install is not understood in combination with the other options

Im Header der Shell steht folgendes:

Linux proxserver 6.8.8-1-pve #1 SMP PREEMPT_DYNAMIC PMX 6.8.8-1 (2024-06-10T11:42Z) x86_64

Hilft das?

Moin,

Mein Fehler, muss so heißen,

# apt list --installed proxmox-pv*

VG
Bernd

1 „Gefällt mir“

Btw. Proxmox ist Debian, aber der Kernel basiert auf Ubuntu. Aktuell Ubuntu 24.04 Kernel. Darum die ganzen Freeze Probleme.

Moin,

Wo kommen denn diese Informationen her, Proxmox baut seine eigenen Kernel!
Installiert ist bei mir,

proxmox-kernel-6.8.8-1-pve-signed/stable,now 6.8.8-1 amd64 [installed,automatic]

VG
Bernd

https://pve.proxmox.com/wiki/Proxmox_VE_Kernel#Proxmox_VE_8.x

1 „Gefällt mir“

Dann kommt nur Listing... Done und das war es.

Moin,

Ok, ich sollte nicht aus dem Gedächtnis schreiben, sondern nachschauen :slight_smile:

root@pve-10:~# apt list --installed proxmox-ve*
Listing... Done
proxmox-ve/stable,now 8.2.0 all [installed]
N: There are 4 additional versions. Please use the '-a' switch to see them.

Sorry für die Verwirrung.

VG
Bernd

Alles gut, jetzt kommt

root@proxserver:~# apt list --installed proxmox-ve*
Listing... Done
proxmox-ve/stable,now 8.2.0 all [installed]
N: There are 4 additional versions. Please use the '-a' switch to see them.

Falls es interessant ist, mit -a erhalte ich die Versionen

proxmox-ve/stable,now 8.2.0 all [installed]
proxmox-ve/stable 8.1.0 all
proxmox-ve/stable 8.0.2 all
proxmox-ve/stable 8.0.1 all
proxmox-ve/stable 8.0.0 all

Ich hatte gestern versucht ein Backup zurückzuspielen und wollte die Größe des Containers gleichzeitig ändern, das ist auf Fehler gelaufen und der komplette LXC ist aus Proxmox entfernt wurden.

Hier in dem Fall versuche ich ADGuard und den Container jetzt nicht mehr zu retten, ist den Aufwand nicht wert.

Wenn es allerdings sinnvoll ist, die eventuell fehlerhafte Proxmox Version zu korrigieren, sagt bescheid. :slight_smile:

Schon mal danke bis hierhin!

Moin,

Das ist ok, dann ist da so weit alles ok.
Welche Repositories hast Du in Proxmox eingebunden?
Ich habe z. B. das Testing nicht aktiv!
Hier mal meine, die sollte aber mit Deiner identisch sein.

root@pve-10:~# cat /etc/apt/sources.list
deb http://deb.debian.org/debian bookworm main contrib
deb http://deb.debian.org/debian bookworm-updates main contrib
deb http://security.debian.org/debian-security bookworm-security main contrib

root@pve-10:~# cat /etc/apt/sources.list.d/*
# deb http://download.proxmox.com/debian/ceph-quincy bookworm enterprise
# deb http://download.proxmox.com/debian/ceph-quincy bookworm no-subscription
# deb http://download.proxmox.com/debian/ceph-reef bookworm enterprise
# deb http://download.proxmox.com/debian/ceph-reef bookworm no-subscription
# deb https://enterprise.proxmox.com/debian/pve bookworm pve-enterprise
deb http://download.proxmox.com/debian/pve bookworm pve-no-subscription
# deb http://download.proxmox.com/debian/pve bookworm pvetest

Wie und welche Fehlermeldung kam da?

Wenn ich LXC die virtuelle Disk größe ändern will, dann mache ich das immer so:

  • LXC stoppen
  • die Konfiguration, des LXC z.B. /etc/pve/lxc/100.conf in den Editor laden
  • die Diskgröße anpassem und abspeichern
  • Backup erstellen
  • LXC löschen
  • das Backup zurückspielen

Es ginge auch so, wenn das Backup lokal liegt

  • lxc stoppen
  • lxc löschen
  • lokales Backup, mittels Archiveprogramm das Backu öffnen und die Konfigurationsdatei des LXC suchen und bearbeiten, abspeichern und wieder archivieren
  • Backup zurückspielen

VG
Bernd

Ich habe weniger:

root@proxserver:~# cat /etc/apt/sources.list.d/*
# deb https://enterprise.proxmox.com/debian/ceph-quincy bookworm enterprise
deb http://download.proxmox.com/debian/ceph-quincy bookworm no-subscription
# deb http://download.proxmox.com/debian/ceph-reef bookworm no-subscription
# deb https://enterprise.proxmox.com/debian/pve bookworm pve-enterprise

Ich konnte mir die Meldung nicht merken, falls ich die überhaupt gesehen habe, aber hier der Task Log

recovering backed-up configuration from 'BackupNAS:backup/vzdump-lxc-102-2024_06_18-05_00_02.tar.zst'
Formatting '/mnt/pve/Backup/images/102/vm-102-disk-0.raw', fmt=raw size=2147483648 preallocation=off
/mnt/pve/Backup/images/102/vm-102-disk-0.raw: Not enough space to build proposed filesystem while setting up superblock
TASK ERROR: unable to restore CT 102 - command 'mkfs.ext4 -O mmp -E 'root_owner=100000:100000' /mnt/pve/Backup/images/102/vm-102-disk-0.raw' failed: exit code 1

Und hier der betreffende System Log

Jun 20 00:15:42 proxserver kernel: CIFS: VFS: bogus file nlink value 0
Jun 20 00:15:47 proxserver kernel: CIFS: VFS: bogus file nlink value 0
Jun 20 00:15:47 proxserver pvedaemon[27241]: unable to restore CT 102 - command 'mkfs.ext4 -O mmp -E 'root_owner=100000:100000' /mnt/pve/Backup/images/102/vm-102-disk-0.raw' failed: exit code 1
Jun 20 00:15:47 proxserver pvedaemon[1180]: <root@pam> end task UPID:proxserver:00006A69:000867BB:6673588D:vzrestore:102:root@pam: unable to restore CT 102 - command 'mkfs.ext4 -O mmp -E 'root_owner=100000:100000' /mnt/pve/Backup/images/102/vm-102-disk-0.raw' failed: exit code 1

Noch ein paar sachdienliche Hinweise:

  1. Ich hatte nach der Neueinrichtung vor mehreren Monaten den Speicherplatz falsch konfiguriert, kein Platz mehr und über die WebGUI konnte ich nichts löschen weil nichts zu finden war. Durch im Netz gefundene Befehle konnte ich die Speicherfresser über die Shell finden und löschen, seitdem hatte ich wieder Platz und es lief auch alles. Ich hatte nachher aber noch eine weitere Platte eingebaut.
  2. Seitdem oder später konnte ich bei “DatenLocal” nur noch Disk-Image und Container auswählen.
  3. Bevor ich das Backup vorgestern versucht habe einzuspielen, ist mir aufgefallen, das im betreffenden Container unter Ressourcen, der Eintrag Root-Disk rot markiert war oder die angezeigte Größe (1024 oder 2048) vermutlich zu klein war. Daher wollte ich beim Restore die Größe anpassen.

Oder die GUI nutzen, zumindest wenn es drum geht die Disk größer zu machen.
Ressources → Volume Aktion → Resize.
Die zusätzliche GB angeben, bestätigen, fertig.
Ein reboot ist nicht notwendig.

Oder ging es explizit darum die Disk Größe zu verkleinern?

Gruß
Osorkon

Moin,

Wieso hast Du das ceph Repository integriert, das ist für Privat nicht wichtig, ich denke, Du hast keinen ceph Cluster am Laufen :wink:

Da steht ja schon, dass Du angeblich nicht genug Speicher hast, weil einige Superblöcke auf der SSD anscheinend nicht sauber sind, also die SSD hat auf jeden Fall einen Schaden, ob man das mit neu Formatieren und anschließendem Check wieder hinbekommt, kann ich aus der Ferne nicht sagen.

/mnt/pve/Backup/images/102/vm-102-disk-0.raw: Not enough space to build proposed filesystem while setting up superblock

Edit Anfang
Es kann natürlich auch sein, dass das RAW File eine viel größeren Plattenplatz braucht, das auf dem Storage zur Verfügung steht, deswegen, nochmal wie ist/sind Deine Platten eingerichtet?
Edit Ende

Das ist normal, siehe


Wie sieht denn das bei Dir aus

Kennst Du die Helfer Skripte?

Lass mal das Skript Proxmox VE Post Install laufen, da werden einige Dinge gerade gezogen.

Ja, da hast Du recht, ich bin davon ausgegangen, dass es ums verkleinern geht.

VG
Bernd