針對警示變更採取行動 - Amazon CloudWatch

針對警示變更採取行動

CloudWatch 可以在兩種類型的警示變更時通知使用者:警示變更狀態時,以及更新警示組態時。

當警示評估時,可能會從一種狀態變更為另一種狀態,例如 ALARM 或 OK。對於監控多個時間序列的 Metrics Insights 警示,每個時間序列 (貢獻者) 只能處於 ALARM 或 OK 狀態,絕不可能處於 INSUFFICIENT_DATA 狀態。這是因為時間序列只在資料存在時才存在。

警示動作和通知

下表顯示 Metrics Insights 警示在警示層級與貢獻者層級分別執行的操作:

動作類型 警示層級 貢獻者層級 詳細資訊
SNS 通知 Amazon SNS 事件目標
EC2 動作 (停止、終止、重新啟動、復原) 建立警示以停止、終止、重新啟動或復原 EC2 執行個體
Auto Scaling 動作 Amazon EC2 Auto Scaling 的步進和簡易擴展政策
Systems Manager OpsItem 建立 設定 CloudWatch 警示以建立 OpsItems
Systems Manager Incident Manager 事件 使用 CloudWatch 警示自動建立事件
Lambda 函式調用 從警示調用 Lambda 函式
CloudWatch 調查功能調查 從警示啟動 CloudWatch 調查

單一指標警示與多時間序列警示的警示通知內容有所不同:

  • 單一指標警示同時包含狀態原因和詳細的狀態原因資料,顯示導致狀態變更的特定資料點。

  • 多時間序列警示提供針對每個貢獻者的簡化狀態原因說明,不包含詳細的狀態原因資料區塊。

範例 通知內容範例

單一指標警示通知中包含詳細資料:

{ "stateReason": "Threshold Crossed: 3 out of the last 3 datapoints [32.6 (03/07/25 08:29:00), 33.8 (03/07/25 08:24:00), 41.0 (03/07/25 08:19:00)] were greater than the threshold (31.0)...", "stateReasonData": { "version": "1.0", "queryDate": "2025-07-03T08:34:06.300+0000", "startDate": "2025-07-03T08:19:00.000+0000", "statistic": "Average", "period": 300, "recentDatapoints": [41, 33.8, 32.6], "threshold": 31, "evaluatedDatapoints": [ { "timestamp": "2025-07-03T08:29:00.000+0000", "sampleCount": 5, "value": 32.6 } // Additional datapoints... ] } }

多時間序列警示通知中包含簡化的原因說明:

{ "stateReason": "Threshold Crossed: 3 datapoints were greater than the threshold (0.0). The most recent datapoints which crossed the threshold: [32.6 (03/07/25 08:29:00)]." }

此外,每當警示變更狀態或建立、刪除或更新警示時,CloudWatch 就會傳送事件至 Amazon EventBridge。您可以撰寫 EventBridge 規則,以便在 EventBridge 接收這些事件時採取動作或收到通知。