本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
統一操作入門:加入關鍵警示以快速管理事件
為了協助快速通知您重大事件,請完成下列步驟,將警示加入 AWS 事件偵測和回應
定義和設定關鍵警示以快速管理事件。如需詳細資訊,請參閱《 事件偵測和回應使用者指南》中的在事件偵測和回應中定義和設定警示。
-
如需使用 Amazon CloudWatch 設定警示的步驟,請參閱《事件偵測和回應使用者指南》中的在事件偵測和回應中定義和設定警示。 如需各種 的重要警示類型 AWS 建議 AWS 服務,請參閱事件偵測和回應 (IDR)
。如果您想要 AWS 自動建立已標記 AWS 資源的關鍵 AWS 警示,請聯絡您的 AWS Unified Operations 團隊。 -
若要重新導向或擷取具有直接 Amazon EventBridge 整合
的第三方 APM 工具的重要警示,例如 DataDog、NewRelic 等,請參閱《 AWS 事件偵測和回應使用者指南》中的從與 Amazon EventBridge 直接整合的 APMs 擷取警示。您必須部署一組 AWS 資源 (AWS Lambda 和 Amazon EventBridge 事件匯流排規則),將警示 (事件) 轉換並重新導向至 AWS 事件偵測和回應。您的 AWS Unified Operations 團隊可協助提供 CloudFormation 範本來安裝這些資源。 -
透過與 Amazon EventBridge 沒有直接整合的第三方 APM 工具,例如 DataDog、NewRelic 等,從您的自訂監控工具重新導向或擷取關鍵警示。如需詳細資訊,請參閱《 AWS 事件偵測和回應使用者指南》中的從與 Amazon EventBridge 直接整合APMs 擷取警示。您必須部署一組 AWS 資源 (API Gateway AWS Lambda 函數和 Amazon EventBridge 事件匯流排規則),將警示 (事件) 轉換並重新導向至 AWS 事件偵測和回應。您的 AWS Unified Operations 團隊可協助提供 CloudFormation 範本來安裝這些資源。
-
-
提供關鍵警示緩解動作的工作負載架構詳細資訊、聯絡人資訊和 Runbook 資訊。若要執行此動作,請執行下列步驟。
下載並完成每個關鍵工作負載或應用程式AWS 的事件偵測和回應工作負載入門問卷,以及與每個唯一工作負載相關的警示擷取問卷。
這些問卷中的資訊可協助 AWS 團隊開發事件修復 Runbook。此 Runbook 可讓採取適當的動作,在關鍵警示造成業務停機之前,快速進行故障診斷和修復。如需範例和範例資訊,請參閱AWS 事件偵測和回應中的工作負載加入和警示擷取問卷。
提供將關鍵警示加入 AWS 事件偵測和回應的存取權
在 AWS 帳戶 執行要由 AWS 事件管理團隊監控的關鍵工作負載的 中部署
AWSServiceRoleForHealth_EventProcessor服務連結角色 (SLR)。如需詳細資訊,請參閱佈建對 AWS 事件偵測和回應的提醒擷取存取權。注意
為了協助您加入大型 AWS 帳戶, AWS 可以為您提供 AWS Command Line Interface 指令碼,以快速追蹤此 SLR 的佈建。
(選用) 如果您的警示位於 Amazon CloudWatch 中,請確定用於警示測試 (上線之前) AWS Identity and Access Management 的使用者或角色在執行關鍵工作負載 AWS 帳戶 的 中具有
cloudwatch:SetAlarmStateIAM 許可。這是加入後警示測試 (遊戲) 所需的。如需詳細資訊,請參閱在AWS 事件偵測和回應中測試加入的工作負載。
建立 AWS 支援 案例以訂閱工作負載以進行快速事件管理。請注意,您的 AWS 帳戶 會自動啟用傳入快速事件管理,這表示您可以透過支援中心主控台 AWS Command Line Interface、 或 AWS 開發套件,向 Unified Operations Incident Detection and Response 佇列提出案例,以進行快速動作。若要 AWS 讓 主動監控和建立具有傳出 AWS 支援 案例的事件,請為您的關鍵工作負載建立 AWS 支援 案例。若要執行此動作,請執行下列步驟。
登入 AWS Support Center Console
,選取建立案例,然後選取技術支援。 對於服務,選取事件偵測和回應。
針對類別選取加入新的工作負載。
針對嚴重性選取一般指引。
連接您在上一個步驟中完成的工作負載和警示問卷。