本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
警报规则的状态和运行状况
本文档主题专为支持 Grafana 版本 12.x 的 Grafana 工作空间而设计。
对于支持 Grafana 10.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 10。
对于支持 Grafana 9.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 9。
对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 8。
警报规则的状态和运行状况可帮助您了解有关警报的几个关键状态指标。
有三个关键组件:警报规则状态、警报实例状态和警报规则运行状况。尽管相关,但每个组件传达的信息略有不同。
警报规则状态
警报规则可能处于以下状态之一:
| 州 | 说明 |
|---|---|
Normal |
评估引擎返回的时间序列均未处于 |
待定 |
评估引擎返回的时间序列中至少有一个处于 |
触发 |
评估引擎返回的时间序列中至少有一个处于 |
正在恢复 |
警报状态不再触发,但尚未恢复正常。 |
注意
警报先过渡到 pending,然后过渡到 firing,因此至少需要两个评估周期才会触发警报。
警报实例状态
警报实例可能处于以下状态之一:
| 州 | 说明 |
|---|---|
Normal |
警报的状态既不是触发也不是待处理,一切正常。 |
待定 |
警报处于活动状态的时间少于配置的阈值持续时间。 |
警报 |
警报处于活动状态的时间超过配置的阈值持续时间。 |
正在恢复 |
先前已触发但不再满足警报条件的警报的状态。警报尚未恢复正常。 |
NoData |
在配置的时间窗口内未收到任何数据。 |
错误 |
尝试评估警报规则时发生的错误。 |
保留上一状态
可以将警报规则配置为在遇到 NoData 或 Error 状态时保留上一个状态。这既可以防止警报触发,也可以阻止解决和重新触发。与正常评估一样,待处理期过后,警报规则将从 Pending 变为 Firing。
警报规则运行状况
警报规则可能具有以下运行状况之一:
| 州 | 说明 |
|---|---|
确定 |
评估警报规则时无错误。 |
错误 |
在评估警报规则时发生错误。 |
NoData |
规则评估期间返回的至少一个时间序列中没有数据。 |
NoData 和 Error 的特殊警报
当警报规则的评估产生 NoData 或 Error 状态时,Grafana Alerting 将生成具有以下附加标签的特殊警报:
| 标签 | 说明 |
|---|---|
alertname |
|
datasource_uid |
导致该状态的数据来源 UID。 |
您可以像处理常规警报一样处理这些警报,方法是添加静默、路由到联系点等。