Proxmox VE 叢集中移除有問題的節點
在叢集中發現到其中有一台設備有問題怕會影響到其他節點話,建議先把有問題的設備移除掉
請仔細閱讀該程序,然後再繼續,因為它可能不是你想要或需要。
最重要的一件事就在本篇的最後面,一定要注意看,不然,會造成無法挽回的嚴重後果。
集叢主機群:
pve1
pve2 ---> 這一台是要移除的主機 (node), 因為常常會當機,但找不出原因。
pve3
-
進到 proxmox VE 的網頁管理介面將,節點 pve2 上所有的 VMs 及 LXC 全部移除或遷移至其它的主機上。
(刪除前建議先把/etc/pve/lxc/*.conf
及/etc/pve/qemu-server/*.conf
全搬移到其他位置,待完成後再把設定檔搬回原來的位置即可),並確認您已經把重要的虛擬機完成備份保留。 -
以 ssh 登入到集叢中的一個節點(node ,也就是集叢中的一台主機)
ssh root@pve
- 查看 集叢狀態
pvecm status
- 查詢結果如下
Quorum information
------------------
Date: Fri Feb 16 10:07:36 2024
Quorum provider: corosync_votequorum
Nodes: 9
Node ID: 0x00000007
Ring ID: 1.fa1
Quorate: Yes
Votequorum information
----------------------
Expected votes: 3
Highest expected: 3
Total votes: 3
Quorum: 3
Flags: Quorate
Membership information
----------------------
Nodeid Votes Name
0x00000001 1 pve3
0x00000003 1 pve (local)
- 在此刻必須先關閉要刪除的節點,並確保它不會再開機。所以先把
pve2
主機關機。再回到剛剛登入的pve
查詢現在的情況:
pvecm nodes
- 查詢結果如下
Membership information
----------------------
Nodeid Votes Name
2 1 pve3
1 1 pve (local)
-
可以確定 pve2 已經關機(失去聯絡)
-
再其中一台主機上下指令(目前是在
pve
) 刪除pve2
這一個 node`
pvecm delnode pve2
- 如果操作成功的話會如下圖
- 再次檢查節點列表
node
,確認已經不存在pve2
這個節點。
pvecm status
或
pvecm nodes
如上面所說的,在刪除 pve2 節點之前,關閉 pve2 的電源 ,並確保它不會在這個網路中再次開機出現是非常重要的。如果 pve2 在這個網路結構中再次開機出現在同一個網路裡,那麼,因為 pve2 還記錄著原來集叢的設定,且 ssh 金鑰等都還存在,所以,pve2 會再次去改寫原來集叢裡的設定……所以,原來集叢將會被 pve2 給搞砸,而且是難以挽回的嚴重問題。
2.如果因為某種原因,您想把 pve2 再次重新加入原來的集叢,其實很簡單,只要重新安裝,但名稱可以使用其他名稱,然後再重新加入原來的集叢就可以了。
3.原來 pve2 的設定仍然保留在 原來集叢的主機裡。