Proxmox VE HA 設定

BUBU 因為公司要模擬如果在 PVE 主機有異常,如何做服務切換到其他 PVE 主機讓服務能夠繼續運行,我順便做一下記錄以防日後遇到問題還可以查看,那建立 HA 服務基本要三台設備有做叢集,就可以執行這樣子的功能

情境


HA 狀況是當該設備有異常狀況時,才會執行此功能服務,但只的針對在 HA 設定好的服務才會正常執行。

  1. A to B 本機設備
    • Guest OS 設定複寫的排程,讓 VM 映像檔複寫到其它設備上
    • 使用此方式會有風險性,那就是複寫排程是多久執行一次,萬一複寫尚未完成或者還沒執行排程話,資料會有漏掉時間差,服務不是很重要或者久久才異動,那使用此方式是可以的,但還是建議盡量是放在儲存設備上這樣子會比較安全
    • Guest OS 服務很多的話,那會建議拿個筆記,記錄一下 Guest OS 複寫到那幾台設備,如果遇到問題可以立即做切換動作
  2. A to B 儲存設備
    • Guest OS VM 檔放置在儲存設備

方法一、HA 設定


  • 首先到資料中心裡面會看到一個 HA 項目

PVE-HA-01.png

  • 在建立 HA 之前,要先建立群組

PVE-HA-02.png

  • 建立群組,ID:是填入群名稱,restricted:打勾,nofaiback:打勾,設定誰那幾台 PVE 主機執行此群組,並且給予順序是數字越大是優先執行切換。如果切換過去另一台設備還是有異常的話,系統會自動切換到下一台設備繼續執行此任務。例如
設備名稱 Priority 備註
pve-1 3 第一優先切換
pve-2 2 有問題設備
pve-3 1 第二優先切換

PVE-HA-03.png

  • 再回到 HA 畫面設定要執行此功能的服務

PVE-HA-04.png

  • VM:選擇要執行的 Guest OS,群組是選擇要有那些 PVE 主機執行此服務,其他都是預設即可

PVE-HA-05.png

  • 此畫面是新增成功的畫面

PVE-HA-06.png

方法二、手動執行


如果在還沒有設定 HA 情況下,有做複寫那就先手動操作設定,但是在手動操作之前要先確認說 Guest OS 服務複寫設定那些主機上有映像檔

  1. 用 PuTTY 先連線到要設定的主機

  2. 先進到 cd /etc/pve/nodes/ 有建立叢集服務就會看到此目錄,該目錄是每一台設備的 Guest OS 設定檔會放在這裡。

pve-ha-07.png

  1. 進到有問題的設備目錄下,在裡面只會進到兩個目錄,其他資料都不要去動,如果是 LXC 服務進到 lxc 目錄下,如果是 VM 服務進到 qemu-server 目錄下

pve-ha-08.png

  1. 假設 Guest OS 是 lxc 服務,開啟 lxc 目錄選擇該服務的代號,例如:代號是 100 的話,把 100.conf 移到,目前你正在操作的主機上一樣放置在 lxc 目錄下,這樣子你就可以在網頁上看到該服務名稱,並且手動去啟動 Guest OS 服務

  2. 使用 WinSCP 手動設定,一樣到正常的服務上面進到 cd /etc/pve/nodes/ 目錄下

PVE-HA-09.png

  1. 進到有問題的設備目錄下,在裡面只會進到兩個目錄,其他資料都不要去動,如果是LXC服務進到lxc目錄下,如果是VM服務進到qemu-server目錄下

PVE-HA-10.png

  1. 一樣照著第四點方式操作即可



參考相關網頁