本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
根據連線的資料來源建立警示
您可以建立警示,以監視不在 CloudWatch 中的資料來源的指標。如需有關建立其他資料來源連線的詳細資訊,請參閱 從其他資料來源中查詢指標。
若要從已連線的資料來源建立指標警示
-
透過 https://console.aws.amazon.com/cloudwatch/
開啟 CloudWatch 主控台。 -
在導覽窗格中,選擇 Metrics (指標)、All metrics (所有指標)。
-
選擇多來源查詢索引標簽。
-
對於資料來源,選取您想要使用的資料來源。
-
查詢建置器會提示您輸入查詢所需的資訊,以擷取用於警示的指標。每個資料來源的工作流程都不同,並針對資料來源量身打造。例如,對於 Amazon Managed Service for Prometheus 和 Prometheus 資料來源,則會出現一個包含查詢協助程式的 PromQL 查詢編輯器方塊。
-
完成查詢的建構後,請選擇圖形查詢。
-
如果範例圖表看起來符合您的預期,請選擇建立警示。
-
指定指標和條件頁面出現。如果使用的查詢產生多個時間序列,將會在頁面頂部看到警告橫幅。如果您這樣做,請選取一個函數,用於彙總彙總函數中的時間序列。
-
(選用) 新增警示標籤。
-
對於當
your-metric-name為…,選擇大於、大於/等於、小於/等於或小於。對於相比…,為閾值指定一個數字。 -
選擇 Additional configuration (其他組態)。針對 Datapoints to alarm (要警示的資料點),請指定 (資料點) 必須處於
ALARM狀態多少評估期間,才會觸發警示。如果此處的兩個值相符,您便可以建立警示,在許多連續期間違規時移至ALARM狀態。若要建立 N 個中有 M 個警示,請針對小於第二個值之數字的第一個值指定數字。如需詳細資訊,請參閱評估警示。
-
對於 Missing data treatment (遺失資料處理方式),選擇警示在遺失某些資料點時的行為。如需詳細資訊,請參閱設定 CloudWatch 警示如何處理遺失資料。
-
選擇下一步。
-
對於通知,請指定當警示轉換為
ALARM、OK或INSUFFICIENT_DATA狀態時要通知的 Amazon SNS 主題。-
(選用) 若要針對相同警示狀態或不同警示狀態傳送多個通知,請選擇 Add notification (新增通知)。
注意
建議您設定警示,以便除了在進入警示狀態外,進入資料不足狀態時應採取動作。這是因為連線至資料來源的 Lambda 函數有許多問題可能會導致警示轉換為資料不足。
-
(選用) 若不傳送 Amazon SNS 通知,請選擇移除。
-
-
若要讓警示執行 Auto Scaling、Lambda 或 Systems Manager 動作,請選擇適當的按鈕,然後選擇警示狀態及要執行的動作。如果選擇 Lambda 函數作為警示動作,則可以指定函數名稱或 ARN,並且可以選擇性地選擇函數的特定版本。
警示只能在進入 ALARM 狀態時執行 Systems Manager 動作。如需有關 Systems Manager 的詳細資訊,請參閱設定 CloudWatch 以從警示建立 OpsItems 和事件建立。
注意
若要建立執行 SSM Incident Manager 動作的警示,您必須具備特定許可。如需詳細資訊,請參閱 AWSSystems Manager Incident Manager 的身分型政策範例。
-
選擇下一步。
-
在 Name and description (名稱和描述) 下,輸入警示的名稱和描述,然後選擇 Next (下一步)。此名稱只能包含 UTF-8 字元,不能包含 ASCII 控制字元。說明可以包括 Markdown 格式,僅在 CloudWatch 主控台的警示詳細資訊標籤中顯示。Markdown 對於將連結新增至執行手冊或其他內部資源很實用。
提示
警示名稱只能包含 UTF-8 字元。它不能包含 ASCII 控制字元。
-
在 Preview and create (預覽及建立) 下,請確認警示資訊和條件都是正確的,然後選擇 Create alarm (建立警示)。
已連線資料來源的警示詳細資訊
-
CloudWatch 評估警示時,即使警示的時間長度超過一分鐘,它也會每分鐘執行一次。若要讓警示運作,Lambda 函數必須能夠傳回從任何一分鐘開始的時間戳記清單,而不僅是週期長度的倍數。這些時間戳記必須相隔一個週期長度。
因此,如果 Lambda 查詢的資料來源只能傳回週期長度倍數的時間戳記,則函數應「重新取樣」擷取的資料,以符合
GetMetricData請求所預期的時間戳記。例如,使用每次偏移一分鐘的五分鐘時段,每分鐘評估一次週期為五分鐘的警示。在此案例中:
-
對於 12:15:00 進行的警示評估,CloudWatch 預期資料點的時間戳記為
12:00:00、12:05:00和12:10:00。 -
然後,對於 12:16:00 進行的警示評估,CloudWatch 預期資料點的時間戳記為
12:01:00、12:06:00和12:11:00。
-
-
CloudWatch 評估警示時,Lambda 函數傳回的與預期時間戳記不符的資料點都會被丟棄,並使用剩餘的預期資料點評估警示。例如,在
12:15:00評估警示時,它預期資料具有12:00:00、12:05:00和12:10:00時間戳記。如果收到時間戳記為12:00:00、12:05:00、12:06:00和12:10:00的資料,則會丟棄來自12:06:00的資料,CloudWatch 會使用其他時間戳記評估警示。然後,對於在
12:16:00進行的下一次評估,它預期資料具有12:01:00、12:06:00和12:11:00時間戳記。如果它只有時間戳記為12:00:00、12:05:00和12:10:00的資料,則所有這些資料點都會在 12:16:00 被忽略,並且警示會根據您指定該警示來處理遺失資料的方式轉換為相應狀態。如需詳細資訊,請參閱評估警示。 -
建議您建立這些警示,以便在它們轉換為
INSUFFICIENT_DATA狀態時採取動作,因為多個 Lambda 函數失敗使用案例都會將警示轉換為INSUFFICIENT_DATA,無論您設定警示以何種方式處理遺失的資料。 -
如果 Lambda 函式傳回錯誤:
-
如果呼叫 Lambda 函數時發生許可問題,警示會開始遺失資料轉換,其依據為您指定該警示在建立時處理遺失資料的方式。
-
任何來自 Lambda 函數的其他錯誤都會導致警示轉換為
INSUFFICIENT_DATA。
-
-
如果 Lambda 函式傳回部分資料:
-
系統將根據傳回的資料點持續評估警示。
-
可以使用下列方法,了解 Lambda 函式警示目前是否正在根據部分資料評估其警示狀態:
-
在主控台中,選擇警示,然後選擇詳細資訊頁面。如果您看到訊息評估警告:未評估該頁面上顯示的所有資料,表示正在評估部分資料。
-
如果您在使用
describe-alarmsAWS CLI命令或 DescribeAlarms API 時,在EvaluationStatePARTIAL_DATA欄位中看到 值,則會評估部分資料。
-
-
當警示進入部分資料狀態時,也會將事件發布至 Amazon EventBridge。
-
-
如果 Lambda 函數請求的指標有一些延遲,從而導致最後一個資料點永遠遺失,您應採取因應措施。可以建立「N 中取 M」警示,或增加警示的評估時間。如需「N 中取 M」警示的詳細資訊,請參閱 評估警示。