使用 Amazon CloudWatch 监控 Amazon EventBridge 调度器 - EventBridge 调度器

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon CloudWatch 监控 Amazon EventBridge 调度器

您可以使用 CloudWatch 监控 Amazon EventBridge 调度器,CloudWatch 会收集原始数据并将其处理为易读且近乎实时的指标。EventBridge 调度器会为所有计划发布一组指标,为关联死信队列 (DLQ) 的计划发出一组额外的指标。如果您为计划配置了 DLQ,则当您的计划用尽其重试策略时,EventBridge 调度器会发布其他指标。

这些统计数据会保存 15 个月,从而使您能够访问历史信息,并能够更好地了解计划失败的原因,并对潜在问题进行故障排除。此外,可以设置用于监测特定阈值的警报,并在达到相应阈值时发送通知或执行操作。有关更多信息,请参阅《Amazon CloudWatch 用户指南》

术语

命名空间

命名空间是用于 AWS 服务的 CloudWatch 指标的容器。对于 EventBridge 调度器,命名空间为 AWS/Scheduler

CloudWatch 指标

CloudWatch 指标表示 CloudWatch 特定的并且按时间排序的数据点集。

维度

维度是名称/值对,是指标身份的一部分。

单位

所有统计数据都有度量单位。对于 EventBridge 调度器,单位包括计数

维度

本节介绍了 CloudWatch 中 EventBridge 调度器指标的 CloudWatch 维度分组。

维度 描述

计划组

您用于使用 CloudWatch 查看指标的计划组。如果您尚未创建任何组,则 EventBridge 调度器会将您的计划与 default 组关联起来。

访问指标

本节介绍如何在 CloudWatch 中访问特定 EventBridge 调度器计划的性能指标。

要查看维度的性能指标,请执行以下操作
  1. 在 CloudWatch 控制台上打开指标页面

  2. 使用 AWS 区域选择器来选择您计划的区域

  3. 选择调度器命名空间。

  4. 所有指标选项卡中,选择一个维度,例如,计划组指标。要查看您在所选区域创建的所有计划的指标,请选择账户指标

  5. 选择 CloudWatch 指标维度。例如,InvocationAttemptCountInvocationDroppedCount,然后选择 Graph 搜索

  6. 选择图表化指标选项卡,查看 EventBridge 调度器指标的性能统计信息。

指标的列表

下表列出了所有 EventBridge 调度器计划的指标,以及您为其配置了 DLQ 的计划的其他指标。

所有计划的指标

命名空间 指标 单位 描述

AWS/Scheduler

InvocationAttemptCount

计数

每次尝试调用时都会发出。使用此指标可检查 EventBridge 调度器是否正在尝试调用您的计划,并查看调用次数何时接近您的账户配额。

AWS/Scheduler

TargetErrorCount

计数

EventBridge 调度器调用目标 API 后,目标返回异常时发出。使用此指标可检查向目标传输失败的时间。

AWS/Scheduler

TargetErrorThrottledCount

计数

在由于目标的 API 节流而导致目标调用失败时发出。当根本原因是 EventBridge 调度器发出的目标 API 节流调用时,使用它来诊断传送失败

AWS/Scheduler

InvocationThrottleCount

计数

当 EventBridge 调度器因目标调用超出其设置的服务限额而限制目标调用时发出。使用此指标可确定何时超过调用限额。有关服务限额的更多信息,请参阅 Amazon EventBridge 计划程序的配额

AWS/Scheduler

InvocationDroppedCount

计数

当计划的重试策略用尽后,EventBridge 调度器停止尝试调用目标时发出。有关重试策略的更多信息,请参阅《EventBridge 调度器 API 参考》中的 RetryPolicy

带有 DLQ 的计划的指标

命名空间 指标 单位 描述

AWS/Scheduler

InvocationsSentToDeadLetterCount

计数

每次成功传输到计划的 DLQ 时都会发出。使用此指标可确定何时将事件发送到 DLQ,然后查看传输到计划 DLQ 的事件,了解有助于确定失败原因的其他详细信息。

AWS/Scheduler

InvocationsFailedToBeSentToDeadLetterCount

计数

在 EventBridge 调度器无法向 DLQ 传输事件时发出。使用这两个指标可确定 EventBridge 调度器无法向 DLQ 发送事件的原因,并修改您的 DLQ 配置以解决问题。

以下是您指定为 DLQ 的 Amazon SQS 队列不存在时的 InvocationsFailedToBeSentToDeadLetterCount_<error_code> 指标示例:InvocationsFailedToBeSentToDeadLetterCount_AWS.SimpleQueueService.NonExistentQueue

AWS/Scheduler

InvocationsFailedToBeSentToDeadLetterCount_<error_code>

计数

AWS/Scheduler

InvocationsSentToDeadLetterCount_Truncated_MessageSizeExceeded

计数

当发送到 DLQ 的事件的有效负载超过 Amazon SQS 允许的最大大小,且 EventBridge 调度器截断您在计划的 Input 属性中指定的有效负载时发出。