Proxmox VE 叢集中移除有問題的節點
如果在叢集中發現到其中有一台設備有問題怕會影響到其他節點話,建議先把有問題的設備移除掉,在看其他的節點看是否有正常
請仔細閱讀該程序,然後再繼續,因為它可能不是你想要或需要。
最重要的一件事就在本篇的最後面,一定要注意看,不然,會造成無法挽回的嚴重後果。
集叢主機群:
pve
pve2 ---> 這一台是要移除的主機 (node), 因為常常會當機,但找不出原因。
pve3
進到 proxmox VE 的網頁管理介面將
節點 pve2 上所有的 VMs 及 LXC 全部移除或遷移至其它的主機上。
(刪除前建議先把 /etc/pve/lxc/*.conf 及 /etc/pve/qemu-server/*.conf 全搬移到其他位置,
待完成後再把設定檔搬回原來的位置即可),並確認您已經把重要的虛擬機完成備份保留。
以 ssh 登入到集叢中的一個節點(node ,也就是集叢中的一台主機)
# ssh [email protected]
查看 集叢狀態
# pvecm status
Quorum information
------------------
Date: Thu Nov 1 08:22:37 2018
Quorum provider: corosync_votequorum
Nodes: 3
Node ID: 0x00000001
Ring ID: 3/32984
Quorate: Yes
Votequorum information
----------------------
Expected votes: 3
Highest expected: 3
Total votes: 3
Quorum: 3
Flags: Quorate
Membership information
----------------------
Nodeid Votes Name
0x00000003 1 pve3
0x00000001 1 pve (local)
在此刻必須先關閉要刪除的節點,並確保它不會再開機。
所以,先把 pve2 主機 關機。
再回到 剛剛登入的 pve 查詢現在的情況:
# pvecm nodes
Membership information
----------------------
Nodeid Votes Name
2 1 pve3
1 1 pve (local)
現在可以確定 pve2 已經不見了(失去聯絡)
再其中一台主機上下指令(目前是在 pve) 刪除 pve2 這一個 node
# pvecm delnode pve2
如果,操作成功的話。
再次檢查節點列表(node),確認已經不存在 pve2 這個節點。
# pvecm status
或
# pvecm nodes
注意:
-
如上面所說的,
在 刪除 pve2 節點 之前,
關閉 pve2 的電源 ,並確保它不會在這個網路中再次開機出現 是非常重要的。
如果 pve2 在這個網路結構中再次開機出現在同一個網路裡,那麼,因為 pve2 還記錄著原來集叢的設定,且 ssh 金鑰等都還存在,所以,pve2 會再次去改寫原來集叢裡的設定……所以,原來集叢將會被 pve2 給搞砸,而且是難以挽回的嚴重問題。 -
如果,因為某種原因,您想把 pve2 再次重新加入原來的集叢,其實很簡單,
只要重新安裝,但名稱可以使用 其他名稱 ,然後再重新加入原來的集叢就可以了。 - 原來 pve2 的設定仍然保留在 原來集叢的主機裡。