根據連線的資料來源建立警示 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

根據連線的資料來源建立警示

您可以建立警示,以監視不在 CloudWatch 中的資料來源的指標。如需有關建立其他資料來源連線的詳細資訊,請參閱 從其他資料來源中查詢指標

若要從已連線的資料來源建立指標警示
  1. 透過 https://console.aws.amazon.com/cloudwatch/ 開啟 CloudWatch 主控台。

  2. 在導覽窗格中,選擇 Metrics (指標)、All metrics (所有指標)。

  3. 選擇多來源查詢索引標簽。

  4. 對於資料來源,選取您想要使用的資料來源。

  5. 查詢建置器會提示您輸入查詢所需的資訊,以擷取用於警示的指標。每個資料來源的工作流程都不同,並針對資料來源量身打造。例如,對於 Amazon Managed Service for Prometheus 和 Prometheus 資料來源,則會出現一個包含查詢協助程式的 PromQL 查詢編輯器方塊。

  6. 完成查詢的建構後,請選擇圖形查詢

  7. 如果範例圖表看起來符合您的預期,請選擇建立警示

  8. 指定指標和條件頁面出現。如果使用的查詢產生多個時間序列,將會在頁面頂部看到警告橫幅。如果您這樣做,請選取一個函數,用於彙總彙總函數中的時間序列。

  9. (選用) 新增警示標籤

  10. 對於your-metric-name 為…,選擇大於大於/等於小於/等於小於。對於相比…,為閾值指定一個數字。

  11. 選擇 Additional configuration (其他組態)。針對 Datapoints to alarm (要警示的資料點),請指定 (資料點) 必須處於 ALARM 狀態多少評估期間,才會觸發警示。如果此處的兩個值相符,您便可以建立警示,在許多連續期間違規時移至 ALARM 狀態。

    若要建立 N 個中有 M 個警示,請針對小於第二個值之數字的第一個值指定數字。如需詳細資訊,請參閱評估警示

  12. 對於 Missing data treatment (遺失資料處理方式),選擇警示在遺失某些資料點時的行為。如需詳細資訊,請參閱設定 CloudWatch 警示如何處理遺失資料

  13. 選擇下一步

  14. 對於通知,請指定當警示轉換為 ALARMOKINSUFFICIENT_DATA 狀態時要通知的 Amazon SNS 主題。

    1. (選用) 若要針對相同警示狀態或不同警示狀態傳送多個通知,請選擇 Add notification (新增通知)。

      注意

      建議您設定警示,以便除了在進入警示狀態外,進入資料不足狀態時應採取動作。這是因為連線至資料來源的 Lambda 函數有許多問題可能會導致警示轉換為資料不足

    2. (選用) 若不傳送 Amazon SNS 通知,請選擇移除

  15. 若要讓警示執行 Auto Scaling、Lambda 或 Systems Manager 動作,請選擇適當的按鈕,然後選擇要執行的警示狀態和動作。如果選擇 Lambda 函數作為警示動作,則可以指定函數名稱或 ARN,並且可以選擇性地選擇函數的特定版本。

    警示只能在進入 ALARM 狀態時執行 Systems Manager 動作。如需有關 Systems Manager 的詳細資訊,請參閱設定 CloudWatch 以從警示建立 OpsItems事件建立

    注意

    若要建立執行 SSM Incident Manager 動作的警示,您必須具備特定許可。如需詳細資訊,請參閱 AWS Systems Manager Incident Manager 的身分型政策範例

  16. 選擇下一步

  17. Name and description (名稱和描述) 下,輸入警示的名稱和描述,然後選擇 Next (下一步)。此名稱只能包含 UTF-8 字元,不能包含 ASCII 控制字元。說明可以包括 Markdown 格式,僅在 CloudWatch 主控台的警示詳細資訊標籤中顯示。Markdown 對於將連結新增至執行手冊或其他內部資源很實用。

    提示

    警示名稱只能包含 UTF-8 字元。它不能包含 ASCII 控制字元。

  18. Preview and create (預覽及建立) 下,請確認警示資訊和條件都是正確的,然後選擇 Create alarm (建立警示)。

已連線資料來源的警示詳細資訊

  • CloudWatch 評估警示時,即使警示的時間長度超過一分鐘,它也會每分鐘執行一次。若要讓警示運作,Lambda 函數必須能夠傳回從任何一分鐘開始的時間戳記清單,而不僅是週期長度的倍數。這些時間戳記必須相隔一個週期長度。

    因此,如果 Lambda 查詢的資料來源只能傳回週期長度倍數的時間戳記,則函數應「重新取樣」擷取的資料,以符合 GetMetricData 請求所預期的時間戳記。

    例如,使用每次偏移一分鐘的五分鐘時段,每分鐘評估一次週期為五分鐘的警示。在此案例中:

    • 對於 12:15:00 進行的警示評估,CloudWatch 預期資料點的時間戳記為 12:00:0012:05:0012:10:00

    • 然後,對於 12:16:00 進行的警示評估,CloudWatch 預期資料點的時間戳記為 12:01:0012:06:0012:11:00

  • CloudWatch 評估警示時,Lambda 函數傳回的與預期時間戳記不符的資料點都會被丟棄,並使用剩餘的預期資料點評估警示。例如,在 12:15:00 評估警示時,它預期資料具有 12:00:0012:05:0012:10:00 時間戳記。如果收到時間戳記為 12:00:0012:05:0012:06:0012:10:00 的資料,則會丟棄來自 12:06:00 的資料,CloudWatch 會使用其他時間戳記評估警示。

    然後,對於在 12:16:00 進行的下一次評估,它預期資料具有 12:01:0012:06:0012:11:00 時間戳記。如果它只有時間戳記為 12:00:0012:05:0012:10:00 的資料,則所有這些資料點都會在 12:16:00 被忽略,並且警示會根據您指定該警示來處理遺失資料的方式轉換為相應狀態。如需詳細資訊,請參閱評估警示

  • 建議您建立這些警示,以便在它們轉換為 INSUFFICIENT_DATA 狀態時採取動作,因為多個 Lambda 函數失敗使用案例都會將警示轉換為 INSUFFICIENT_DATA,無論您設定警示以何種方式處理遺失的資料。

  • 如果 Lambda 函數傳回錯誤:

    • 如果呼叫 Lambda 函數時發生許可問題,警示會開始遺失資料轉換,其依據為您指定該警示在建立時處理遺失資料的方式。

    • 任何來自 Lambda 函數的其他錯誤都會導致警示轉換為 INSUFFICIENT_DATA

  • 如果 Lambda 函數傳回部分資料:

    • 警示會在傳回的資料點上繼續評估。

    • 您可以使用下列方法來找出 Lambda 函數上的警示目前是否正在根據部分資料評估其警示狀態:

      • 在 主控台中,選擇警示,然後選擇詳細資訊頁面。如果您看到訊息評估警告:未評估所有資料會顯示在該頁面上,表示正在評估部分資料。

      • 如果您在使用 describe-alarms AWS CLI 命令或 DescribeAlarms API 時在 EvaluationState PARTIAL_DATA欄位中看到 值,則會評估部分資料。

    • 當事件進入部分資料狀態時,警示也會將事件發佈至 Amazon EventBridge。

  • 如果 Lambda 函數請求的指標有一些延遲,從而導致最後一個資料點永遠遺失,您應採取因應措施。可以建立「N 中取 M」警示,或增加警示的評估時間。如需「N 中取 M」警示的詳細資訊,請參閱 評估警示