跳到主內容

Proxmox VE 叢集中移除有問題的節點

  在叢集中發現到其中有一台設備有問題怕會影響到其他節點話,建議先把有問題的設備移除掉

  請仔細閱讀該程序,然後再繼續,因為它可能不是你想要或需要。

最重要的一件事就在本篇的最後面,一定要注意看,不然,會造成無法挽回的嚴重後果。

集叢主機群:
pve1 pve2 ---> 這一台是要移除的主機 (node), 因為常常會當機,但找不出原因。 pve3

  • 進到 proxmox VE 的網頁管理介面將,節點 pve2 上所有的 VMs 及 LXC 全部移除或遷移至其它的主機上。
    (刪除前建議先把 /etc/pve/lxc/*.conf/etc/pve/qemu-server/*.conf 全搬移到其他位置,待完成後再把設定檔搬回原來的位置即可),並確認您已經把重要的虛擬機完成備份保留。

  • 以 ssh 登入到集叢中的一個節點(node ,也就是集叢中的一台主機)

ssh root@pve
  • 查看 集叢狀態
pvecm status
  • 查詢結果如下
Quorum information
------------------
Date:             Fri Feb 16 10:07:36 2024
Quorum provider:  corosync_votequorum
Nodes:            9
Node ID:          0x00000007
Ring ID:          1.fa1
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   3
Highest expected: 3
Total votes:      3
Quorum:           3  
Flags:            Quorate 

Membership information
----------------------
    Nodeid      Votes Name
0x00000001          1 pve3
0x00000003          1 pve (local)
  • 在此刻必須先關閉要刪除的節點,並確保它不會再開機。所以先把 pve2 主機關機。再回到剛剛登入的 pve 查詢現在的情況:
pvecm nodes
  • 查詢結果如下
Membership information
----------------------
    Nodeid      Votes Name
         2          1 pve3
         1          1 pve (local)
  • 可以確定 pve2 已經關機(失去聯絡)

  • 再其中一台主機上下指令(目前是在 pve) 刪除 pve2 這一個 node`

pvecm delnode pve2
  • 如果操作成功的話會如下圖

Snipaste_2024-02-16_09-51-18.png

  • 再次檢查節點列表 node ,確認已經不存在 pve2 這個節點。
pvecm status
或  
pvecm nodes

​​

如上面所說的,在刪除 pve2 節點之前,關閉 pve2 的電源 ,並確保它不會在這個網路中再次開機出現是非常重要的。如果 pve2 在這個網路結構中再次開機出現在同一個網路裡,那麼,因為 pve2 還記錄著原來集叢的設定,且 ssh 金鑰等都還存在,所以,pve2 會再次去改寫原來集叢裡的設定……所以,原來集叢將會被 pve2 給搞砸,而且是難以挽回的嚴重問題。

2.如果因為某種原因,您想把 pve2 再次重新加入原來的集叢,其實很簡單,只要重新安裝,但名稱可以使用其他名稱,然後再重新加入原來的集叢就可以了。

3.原來 pve2 的設定仍然保留在 原來集叢的主機裡。

參考相關網頁