本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
配置数据来源管理的警报规则
本文档主题专为支持 Grafana 10.x 版本的 Grafana 工作区而设计。
有关支持 Grafana 版本 12.x 的 Grafana 工作空间,请参阅。在 Grafana 版本 12 中工作
对于支持 Grafana 9.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 9。
对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 8。
为启用了 ruler API 的外部 Grafana Mimir 或 Loki 实例创建警报规则;这些规则称为数据来源管理的警报规则。
注意
具有编辑者或管理员角色的用户可以编辑或删除外部 Grafana Mimir 或 Loki 实例的警报规则。
如果删除在 UI 中创建的警报资源,则无法再对其检索。要备份配置并恢复已删除的警报资源,请使用 Terraform 或警报 API 创建警报资源。
先决条件
-
验证您是否拥有 Prometheus 或 Loki 数据来源的写入权限。如果没有,您将无法创建或更新 Grafana Mimir 管理的警报规则。
-
对于 Grafana Mimir 和 Loki 数据来源,通过配置其各自的服务启用 Ruler API。
注意
如果您不想管理特定 Loki 或 Prometheus 数据来源的警报规则,请转到其设置,并清除通过 Alerting UI 管理警报复选框。
在以下过程中,我们将引导您完成创建数据来源管理的警报规则的过程。
要创建数据来源管理的警报规则,请使用工作区内警报创建流程,并按照以下步骤操作。
设置警报规则名称
-
选择警报 -> 警报规则 -> + 新建警报规则。
-
输入名称以识别警报规则。
此名称将显示在警报规则列表中。这也是根据此规则创建的每个警报实例的
alertname标签。
定义查询以获取要测量的数据,以及触发警报规则之前需要满足的条件。
定义查询和条件
-
默认情况下,所有警报规则均由 Grafana 管理。要切换到数据来源管理的警报规则,请选择切换到数据来源管理的警报规则。
-
从下拉列表中选择数据来源。
您还可以选择打开高级数据来源选取器以查看更多选项,包括添加数据来源(仅限管理员)。
-
输入 PromQL 或 LogQL 查询。
-
选择预览警报。
使用警报规则评估来确定评估警报规则的频率以及更改状态的速度。
设置警报评估行为
-
选择命名空间或选择 + 新建命名空间。
-
选择评估组或选择 + 新建评估组。
如果要创建新的评估组,请指定该组的间隔。
同一组中的所有规则在同一时间间隔内按顺序进行评估。
-
输入待处理期。
待处理期是指警报规则在触发之前可以违反条件的时段。
满足条件后,警报将进入
Pending状态。如果条件在指定的持续时间保持为激活状态,警报将转入Firing状态,否则将恢复为Normal状态。
在警报规则中添加标签,以设置由哪个通知策略处理触发警报实例。
所有警报规则和实例(无论其标签如何)都匹配默认通知策略。如果没有嵌套策略,或者没有嵌套策略与警报规则或警报实例中的标签相匹配,则默认通知策略就是匹配的策略。
配置 通知
-
如果要更改通知的路由方式,请添加标签。
从下拉列表中选择现有键值对来添加自定义标签,或者输入新的键或值来添加新标签。
添加注释以在警报通知中提供有关警报的更多上下文。
注释添加了元数据,可在警报通知中提供更多警报信息。例如,添加 Summary 注释,以便告知哪个值导致警报触发,或者警报发生在哪个服务器上。
添加注释
-
[可选] 添加摘要。
简要总结了发生的事件和原因。
-
[可选] 添加描述。
描述警报规则的作用。
-
[可选] 添加运行手册 URL。
存放警报运行手册的网页
-
[可选] 添加自定义注释
-
[可选] 添加控制面板和面板链接。
将警报链接到控制面板中的面板。
-
选择保存规则。