Proxmox VE 叢集中移除有問題的節點

           如果在叢集中發現到其中有一台設備有問題怕會影響到其他節點話,建議先把有問題的設備移除掉,在看其他的節點看是否有正常

請仔細閱讀該程序,然後再繼續,因為它可能不是你想要或需要。
最重要的一件事就在本篇的最後面,一定要注意看,不然,會造成無法挽回的嚴重後果。

集叢主機群:
pve
pve2 ---> 這一台是要移除的主機 (node), 因為常常會當機,但找不出原因。
pve3
 

進到 proxmox VE 的網頁管理介面將
節點 pve2 上所有的 VMs 及 LXC 全部移除或遷移至其它的主機上。
(刪除前建議先把 /etc/pve/lxc/*.conf 及 /etc/pve/qemu-server/*.conf 全搬移到其他位置,
待完成後再把設定檔搬回原來的位置即可),並確認您已經把重要的虛擬機完成備份保留。
 

以 ssh 登入到集叢中的一個節點(node ,也就是集叢中的一台主機)
# ssh [email protected]e
 

查看 集叢狀態
# pvecm status

Quorum information
------------------
Date:             Thu Nov  1 08:22:37 2018
Quorum provider:  corosync_votequorum
Nodes:            3
Node ID:          0x00000001
Ring ID:          3/32984
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   3
Highest expected: 3
Total votes:      3
Quorum:           3
Flags:            Quorate

Membership information
----------------------
    Nodeid      Votes Name
0x00000003          1 pve3
0x00000001          1 pve (local)

在此刻必須先關閉要刪除的節點,並確保它不會再開機。
 所以,先把 pve2 主機 關機。
再回到 剛剛登入的 pve 查詢現在的情況: 
# pvecm nodes

Membership information
----------------------
    Nodeid      Votes Name
         2          1 pve3
         1          1 pve (local)

現在可以確定 pve2 已經不見了(失去聯絡)

再其中一台主機上下指令(目前是在 pve) 刪除 pve2 這一個 node
# pvecm delnode pve2

如果,操作成功的話。

 

再次檢查節點列表(node),確認已經不存在 pve2 這個節點。
# pvecm status

# pvecm nodes

​​
注意:

  1. 如上面所說的,
    在 刪除 pve2 節點 之前,
    關閉 pve2 的電源 ,並確保它不會在這個網路中再次開機出現 是非常重要的。

    如果 pve2 在這個網路結構中再次開機出現在同一個網路裡,那麼,因為 pve2 還記錄著原來集叢的設定,且 ssh 金鑰等都還存在,所以,pve2 會再次去改寫原來集叢裡的設定……所以,原來集叢將會被 pve2 給搞砸,而且是難以挽回的嚴重問題。
  2. 如果,因為某種原因,您想把 pve2 再次重新加入原來的集叢,其實很簡單,
    只要重新安裝,但名稱可以使用 其他名稱 ,然後再重新加入原來的集叢就可以了。
  3. 原來 pve2 的設定仍然保留在 原來集叢的主機裡。

 

參考相關網頁: