Amazon EVS 主機維護 - Amazon Elastic VMware Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EVS 主機維護

由於 Amazon EVS 是自我管理的服務,因此您必須負責維護在主機上執行的 VMware Cloud Foundation (VCF) 軟體、監控主機運作狀態,以及修復主機問題,包括主機故障時的主機替換。如需在 VMware Cloud Foundation (VCF) 中管理 ESXi 主機的詳細資訊,請參閱 VMware Cloud Foundation 文件中的主機管理

檢查基礎 EC2 執行個體的運作狀態

Amazon EC2 會在每一次執行 EC2 執行個體時執行自動化檢查,以識別硬體和軟體問題。您可以在 EC2 主控台中檢視這些狀態檢查的結果 AWS CLI ,或識別特定且可偵測的問題。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的檢視 Amazon EC2 執行個體的狀態檢查,以及《 AWS CLI 命令列參考》中的 describe-instance-statusAmazon EC2

您可以建立 CloudWatch 警示,在特定執行個體上的狀態檢查失敗時提醒您。如需詳細資訊,請參閱《tje Amazon EC2 使用者指南》中的為狀態檢查失敗的 Amazon EC2 執行個體建立 CloudWatch 警示Amazon EC2

關於 EC2 執行個體的 AWS 排程維護

AWS 對基礎 EC2 執行個體執行排程維護,以確保可靠性、可用性和效能。EC2 裸機執行個體的排程事件類型與其他 EC2 執行個體相同。 AWS 可以排程事件以重新啟動、停止和淘汰您的執行個體,因為基礎硬體問題或排程維護。這些事件不會頻繁發生。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的排程事件類型

注意

在任何排定的重新啟動事件之前,您應該將主機置於 vSphere 用戶端中的維護模式。

如果您的其中一個執行個體將受到排程事件的影響, 會使用與您相關聯的電子郵件地址,透過電子郵件提前 AWS 通知您 AWS 帳戶。 AWS 也會傳送 AWS 運作狀態事件,您可以使用 Amazon EventBridge 來監控和管理該事件。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的使用 Amazon EventBridge 監控 AWS 運作狀態中的事件和 Amazon EC2 執行個體的排程事件。 Amazon EC2 Amazon EC2

您可以隨時重新排程事件,使其在適合您的特定日期和時間發生。事件最晚可以重新排程到事件截止日期。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的重新排程 EC2 執行個體的排程事件Amazon EC2

使用 EC2 隨需容量預留

您可以使用 EC2 隨需容量預留,以確保您的叢集在維護期間有足夠的容量。您可以保留特定可用區域中任何持續時間的容量。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的使用 EC2 隨需容量保留保留運算容量Amazon EC2

如需建立容量保留的步驟,請參閱《Amazon EC2 使用者指南》中的建立容量保留

注意

如果您使用 EC2 隨需容量預留或 EC2 專用主機,我們建議您為關鍵任務工作負載保留備用主機。雖然容量預留可確保您可以在指定的可用區域中存取特定數量的 EC2 執行個體容量,但讓備用主機提供額外的備援層,這對於關鍵任務工作負載至關重要。對於專用主機,擁有備用主機可確保您維護關鍵任務工作負載的環境,即使主要主機需要維護或遇到問題。

準備 AWS 排程 system-maintenanceinstance-retirement事件

AWS 會排程兩種類型的system-maintenance事件:網路維護和電源維護。

  • 在網路維護期間,排程執行個體會暫時遺失網路連線能力。維護完成後,便會還原您執行個體的一般網路連線能力。

  • 在電源維護期間,排程執行個體會暫時離線,然後重新開機。在 EC2 裸機執行個體上執行重新啟動時,不會保留執行個體存放磁碟區資料。

AWS 當偵測到託管 EC2 執行個體的基礎硬體降級時, 會排程 EC2 instance-retirement事件。

若要修復 system-maintenanceinstance-retirement事件,請在發生維護事件之前,使用 Amazon EVS 主控台或 AWS CLI 和 SDDC Manager 將失敗的主機取代為新主機。如果您等待發生維護事件,且需要重新啟動 EC2 執行個體,則會遺失存放在執行個體存放區磁碟區中的 vSAN 資料。如需詳細步驟,請參閱取代 Amazon EVS 主機

重要

EC2 主控台不應用於管理 Amazon EVS 主機的狀態,包括停止、啟動和終止。請勿嘗試啟動、停止或終止 Amazon EVS 部署的 EC2 執行個體。此動作會導致 vSAN 資料遺失。

取代 Amazon EVS 主機

依照此程序來取代 Amazon EVS 主機。

警告

Amazon EVS 主機使用自訂廠商附加元件來提供重要的主機功能。當您將主機新增至您的環境時,將會有最新版本的 Amazon EVS 自訂附加元件。如果您的環境使用具有較舊附加元件版本的主機,將主機新增至 vSphere 叢集會導致叢集映像修復失敗。如需疑難排解此問題的步驟,請參閱 故障診斷因不相容的叢集映像而新增主機失敗

警告

如果您已在部署後更新 ESXi 版本,SDDC 管理員可能會在委託主機步驟中的 VCF 主機驗證期間失敗。如需疑難排解此問題的步驟,請參閱 SDDC Manager 在主機測試期間未通過 VCF 主機驗證

注意

請確定每個 EVS 環境配額的 Amazon EVS 主機計數已正確設定,以確保成功建立主機。如果此配額值少於您嘗試在單一 Amazon EVS 環境中佈建的主機數量,則主機建立會失敗。您可能需要為需要主機替換的維護操作請求提高配額。如需詳細資訊,請參閱Amazon EVS 服務配額

Amazon EVS console and SDDC Managuer UI
  1. 前往 Amazon EVS 主控台

  2. 在導覽窗格中,選擇環境

  3. 選取包含要取代之主機的環境。

  4. 選取主機索引標籤。

  5. 選擇 Create host (建立主機)

  6. 指定主機詳細資訊,然後選擇建立主機

  7. 若要驗證完成,請檢查主機狀態是否已變更為已建立

  8. 從 AWS Secrets Manager 擷取 ESXi 根密碼的登入資料。如需擷取秘密的詳細資訊,請參閱《 AWS Secrets Manager 使用者指南》中的從 Secrets Manager 取得 AWS 秘密

  9. 移至 SDDC Manager。

  10. 使用您在上一個步驟中擷取的 ESXi 根登入資料,在 SDDC Manager 中委任新主機。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的 Commission Hosts

  11. 將新主機新增至叢集。如需詳細資訊,請參閱 vSphere 文件中的如何使用 Quickstart 工作流程將 ESXi 主機新增至 vSphere 叢集。 vSphere

  12. 停用 SDDC Manager 中您要從 SDDC Manager 移除的舊主機。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的停用主機

  13. 返回 Amazon EVS 主控台。

  14. 主機索引標籤下,選取失敗的主機,然後選擇刪除 > 刪除主機

AWS CLI and SDDC Manager UI
  1. 開啟新的終端機工作階段。

  2. 建立新的主機。如需參考,請參閱以下命令範例。

    aws evs create-environment-host \ --environment-id "env-abcde12345" \ --host '{ \ "hostName": "esxi-host-05", \ "keyName": "your-ec2-keypair-name", \ "instanceType": "i4i.metal" \ }'
  3. 從 AWS Secrets Manager 擷取 ESXi 根密碼的登入資料。如需擷取秘密的詳細資訊,請參閱《 AWS Secrets Manager 使用者指南》中的從 Secrets Manager 取得 AWS 秘密

  4. 移至 SDDC Manager。

  5. 使用您在上一個步驟中擷取的 ESXi 根登入資料,在 SDDC Manager 中委任新主機。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的 Commission Hosts

  6. 將新主機新增至包含受損主機的叢集。

  7. 在 SDDC Manager 中停用受損的主機。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的停用主機

  8. 返回終端機。

  9. 刪除失敗的主機。如需參考,請參閱以下命令範例。

    aws evs delete-environment-host --environment-id "env-abcde12345" --host-name "esxi-host-05"

疑難排解

如需疑難排解指引,請參閱 疑難排解。如果您在檢閱疑難排解指引後仍遇到問題,請聯絡 AWS Support 以取得進一步協助。