什麼是 AWS 事件偵測與回應? - AWS 事件偵測與回應使用者指南

什麼是 AWS 事件偵測與回應?

AWS 事件偵測與回應為符合資格的 AWS 企業支援客戶提供主動的事件參與,以減少失敗的可能性,並加速關鍵工作負載從中斷情況復原。事件偵測與回應可促進您與 AWS 協作,以開發針對每個上線工作負載自訂的執行手冊和回應計劃。

事件偵測與回應提供下列主要功能:

  • 改善可觀測性:AWS 專家提供指引,協助您在工作負載的應用程式和基礎結構層之間定義指標和警示並使其相互關聯,以便及早偵測到中斷情形。

  • 5 分鐘回應時間:事件管理工程師 (IME) 負責全年無休監控您的上線工作負載,以偵測關鍵事件。IME 會在警示觸發後 5 分鐘內回應,或回應您對事件偵測與回應提出的關鍵業務支援案例。

  • 加速解決:IME 使用專為您工作負載開發的預先定義自訂執行手冊在 5 分鐘內回應、代表您建立支援案例,以及管理工作負載的事件。IME 為事件提供單一執行緒擁有權,並讓您與合適的 AWS 專家保持互動,直到事件解決為止。

  • 降低失敗的可能性:解決之後,IME 會為您提供事件後檢討 (提出請求時)。此外,AWS 專家會與您一起運用學到的經驗來改善事件回應計畫和執行手冊。您也可以利用 AWS Resilience Hub 在工作負載上持續追蹤恢復能力。