Komu se nestalo, že nějaká noda zdechla, nebo se „odhlásila“ z clusteru, byla samostatně přístupná, ale zbytku clusteru se hlásila jako červená, tedy nedostupná, tak nepoužíval proxmox.
Tady na obrázku ukazuji nodu 206, ale stejný problém se odehrával u nody 202, která vypadla potom, co jsem updatoval všechny ostatní nody a tuto nodu jsem chtěl updatovat poslední a už se mi ji po updatu nepodařilo dostat zpět do clusteru.
Mě to zdechalo na této hlášce:
permission denied - invalid PVE ticket (401)
Ještě jedna rada, buďte připravení, že jste o nodu i její data mohli přijít, proto se věnujte zálohování a pečlivé záloze obsahu celé nody.
Dle tohoto návodu se přihlašte na terminál „poškozené nody“ v mém případě pve202:
https://pve.proxmox.com/pve-docs-6/chapter-pvecm.html
systemctl stop pve-cluster ; systemctl stop corosync ; mv /etc/pve/corosync.conf root/ ; mkdir /root/corosync/ ; mv /etc/corosync/* /root/corosync/ ; killall pmxcfs ; systemctl start pve-cluster
Pak se logněte zpět na první nodu (v našem případě pve201) na terminál, kde zadáte příkaz:
pvecm delnode pve202
Pak se přihlašte na web nody pve201 / klikněte nahoře na cluster / klikněte na join information / copy information
Logněte klidně na web na poškozenou nodu (pve 202) / klikněte nahoře na cluster / join cluster a vložte join information z nody a nodu byste měli mít zpátky v clusteru.
Opravme nodu 206
Logněme na terminál pro node pve201 a zadejme na ni příkaz:
pvecm delnode pve206
vypíše:
Could not kill node (error = CS_ERR_NOT_EXIST)
Killing node 6
Opakovaný kill už potvrdí, že je noda pryč z clusteru:
pvecm delnode pve206
Node/IP: pve206 is not a known host of the cluster.
Mašina je pryč:
A třeba na nodě 206 je úplně nějaká divná konfigurace, že nejde dát join cluster.
Na webu možná nejde dát join cluster, ale příkazem ano.
Na poškozené nodě dejme
pvecm add pve201
Což nám vypíše detected the following error(s):
- cluster config ‚/etc/pve/corosync.conf‘ already exists // <- systemctl stop corosync ; rm -rf /etc/pve/corosync.conf
- this host already contains virtual guests //musíme najít konfiguráky a přesunout je pryč
Check if node may join a cluster failed!
řešení na nodě, kterou jsme odebrali z clusteru:
pvecm status
Error: Corosync config ‚/etc/pve/corosync.conf‘ does not exist – is this node part of a cluster?
Teď je čas na zálohu virtuálky:
ls /etc/pve/qemu-server
100.conf
přesuňme soubor třeba do /root/
Z tohoto zdroje rada:
– stop all the VMs on the joining node
– move the VMs descriptors within /etc/pve/nodes/[NODENAME]/qemu-server to /home/_cluster_bck
– join the cluster
– copy the backup VMs descriptors back to /etc/pve/nodes/[NODENAME]/qemu-server
např:
mv /etc/pve/nodes/pve*/qemu-server /root/
Připojte nodu zpět do clusteru (klidně už i přes web) a máte hotovo:
V čem byl háček u mě? v /etc/pve/nodes/pve20*/qemu-server/ se nacházely .conf soubory, já je přesunul pryč. A pak už to šlo.
Zde ukázka hezkého videonávodu pro vás ostatní