CloudWatch 警报 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CloudWatch 警报

在操作 Amazon RDS 数据库实例时,您需要监控不同类型的指标、事件和跟踪并生成提醒。对于 MySQL 和 MariaDB 数据库,关键的信息来源是数据库实例指标操作系统指标事件、日志和审计跟踪记录。我们建议您使用CloudWatch 警报来监视您指定的时间段内的单个指标。

以下示例说明如何设置告警,监视所有 Amazon RDS 数据库实例的 CPUUtilization 指标(CPU 利用率百分比)。您可以将告警配置为在 5 分钟的评估期内任何数据库实例的 CPU 利用率超过 80% 时触发。

为 CPUUtilization 指标设置警报

这意味着,如果您的任何数据库在 5 分钟或更长时间内出现高 CPU 利用率(超过 80%),告警就会进入 ALARM 状态。如果 CPU 在短时间内偶尔爆发增至 80% 以上的利用率,然后再次降至阈值以下,则告警将保持 OK 状态。下图说明了此逻辑。

告警状态和阈值

CloudWatch 警报支持指标和复合警报。

  • 指标警报监视单个 CloudWatch 指标,并且可以对该指标执行数学表达式。指标告警可以发送 Amazon SNS 消息,而 Amazon SNS 消息可以根据指标值相对于给定阈值在多个时间段内的值,执行一项或多项操作。

  • 复合告警基于规则表达式,该表达式评估多个告警的状态,并且只有在满足规则的所有条件时才会进入 ALARM 状态。复合告警通常用于减少不必要的提醒数量。例如,您可能有一个复合告警,其中包含多个配置为从不执行操作的指标告警。当组合中的所有单个指标告警都已包含在 ALARM 中时,复合告警将发送提醒

CloudWatch 警报只能监视 CloudWatch 指标。如果要根据错误、慢速查询或一般日志创建警报,则必须从日志中创建 CloudWatch 指标。如前面的操作系统监控事件、日志和审计跟踪记录部分所述,您可以使用筛选条件根据日志事件创建指标,来实现这一点。同样,要对增强监控指标发出警报,必须在 “ CloudWatch 日志” CloudWatch 中创建指标筛选器。