在事件偵測與回應中測試上線的工作負載
注意
您用於警示測試的 AWS Identity and Access Management 使用者或角色必須具有 cloudwatch:SetAlarmState 許可。
上線程序的最後一個步驟是為您的新工作負載執行 Gameday。警示擷取完成後,AWS 事件偵測與回應會確認您選擇開始 Gameday 的日期和時間。
您的 Gameday 有兩個主要目的:
功能驗證:確認 AWS 事件偵測與回應可以正確接收您的警示事件。此外,功能驗證會確認您的警示事件觸發適當的執行手冊和任何其他必要的動作,例如,自動建立案例 (若您在警示擷取期間選取)。
模擬:Gameday 會完整模擬真實事件期間可能發生的狀況。AWS 事件偵測與回應會依照您制定的執行手冊步驟,讓您深入了解實際事件可能發生的情形。Gameday 是您提出問題或精進指示,以改善參與度的機會。
在警示測試期間,AWS 事件偵測與回應會與您一起修復發現的任何問題。
CloudWatch 警示
AWS 事件偵測與回應透過監控警示的狀態變更來測試 Amazon CloudWatch 警示。若要這樣做,請使用 AWS Command Line Interface 手動將警示變更為警示狀態。您也可以從 AWS CloudShell 存取 AWS CLI。AWS 事件偵測與回應提供 AWS CLI 命令清單,可讓您在測試期間使用。
設定警示狀態的範例 AWS CLI 命令:
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
若要進一步了解手動變更 CloudWatch 警示的狀態,請參閱 SetAlarmState。
若要進一步了解 CloudWatch API 操作所需的許可,請參閱 Amazon CloudWatch 許可參考。
第三方 APM 警示
使用 Datadog、Splunk、New Relic 或 Dynatrace 這類第三方應用程式效能監控 (APM) 工具的工作負載,需要不同的指示來模擬警示。在 Gameday 開始時,AWS 事件偵測與回應會要求您暫時變更警示閾值或比較運算子,以強制警示進入 ALARM 狀態。此狀態會觸發 AWS 事件偵測與回應的承載。
重要輸出
重要輸出:
警示擷取成功,且您的警示組態正確。
AWS 事件偵測與回應成功建立和接收警示。
此時會建立支援票證讓您參與,您指定的聯絡人也會收到通知。
AWS 事件偵測與回應可以透過您指定的會議方式與您互動。
Gameday 過程中產生的所有警示和支援案例都會獲得解決。
此時會傳送 Go-Live 電子郵件,確認您的工作負載現在受到 AWS 事件偵測與回應的監控。