驗證是否發生自動執行個體復原 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

驗證是否發生自動執行個體復原

若您的執行個體似乎已離線,然後意外重新啟動,則可能已進行自動執行個體復原,以回應基礎硬體或軟體問題。您可透過檢查 AWS Health Dashboard中的自動執行個體復原事件進行驗證。您也可透過檢查 StatusCheckFailed_System Amazon CloudWatch 指標,確認執行個體是否偵測到基礎硬體或軟體問題。

檢查 中的事件 AWS Health Dashboard

發生自動執行個體復原嘗試時, 會將事件 AWS 傳送至您的 AWS Health Dashboard。具體事件取決於設定的復原機制,以及嘗試是否成功。

在 中檢查自動執行個體復原事件 AWS Health Dashboard
  1. 在 AWS Health Dashboard https://https://phd.aws.amazon.com/phd/home#/ 開啟 。

  2. 尋找與自動執行個體復原關聯的事件。這些事件的存在可確認是否發生自動執行個體復原的嘗試及其相應結果。

    • 簡化的自動復原

      • 成功事件:AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

      • 失敗事件:AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE

    • 基於 CloudWatch 動作的復原

      • 成功事件:AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS

      • 失敗事件:AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

透過 CloudWatch 監控系統狀態檢查

您可透過檢查 CloudWatch 中的 StatusCheckFailed_System 指標,以驗證執行個體是否偵測到基礎硬體或軟體問題。指標值指出系統狀態檢查是通過 (沒有硬體或軟體問題) 還是失敗 (硬體或軟體問題)。

驗證是否偵測到基礎硬體或軟體問題
  1. 透過 https://console.aws.amazon.com/cloudwatch/home?#metricsV2 開啟 CloudWatch 主控台指標頁面。

  2. 確認您位於 EC2 執行個體所在的同一區域。

  3. 指標搜尋欄位中貼上下列指標,然後按 Enter 鍵。

    StatusCheckFailed_System
  4. 選擇 EC2 > 每個執行個體指標

  5. 在表格中,選取要檢查的執行個體旁的核取方塊。

  6. 將查詢期間變更為您懷疑發生了復原事件的時間。

  7. 選擇圖形化指標索引標籤,並針對 StatusCheckFailed_System,請執行下列動作:

    1. 對於統計資料,選擇平均值最大值最小值

    2. 對於期間,選擇 1 分鐘

  8. 檢查 StatusCheckFailed_System 的數值。

    • 數值為 0:系統狀態檢查通過,表示沒有基礎硬體或軟體問題。

    • 數值為 1:系統狀態檢查失敗,表示存在基礎硬體或軟體問題。

如需詳細資訊,請參閱自動執行個體復原功能