;报警;探索Grafana报警;健康状态和报警规则

健康状态和报警规则

的状态和健康提醒规则帮助你了解几个关键状态指标警报。

有三个主要组件:预警规则状态,警报实例状态,预警规则健康。虽然相关,每个组件传达微妙的不同的信息。

预警规则状态

一个警告规则可以在以下状态:

状态 描述
正常的 没有返回的时间序列在评估引擎等待发射状态。
等待 至少有一个评估引擎返回的时间序列等待
发射 至少有一个评估引擎返回的时间序列发射

注意:警报将首先过渡等待然后发射,因此将需要至少两个评价周期警报之前解雇。

警报实例状态

警报的实例可以在以下国家:

状态 描述
正常的 警觉的状态,既不发射也不等待,一切工作正常。
等待 警觉的状态,一直积极不到时间配置的阈值。
报警 警报时,一直积极的状态持续时间超过配置的阈值。
NoData后 没有收到数据配置的时间窗口。
错误 错误发生时试图评估一个报警规则。

预警规则健康

一个警告规则可以有一个健康状态如下:

状态 描述
好吧 当评估一个报警规则没有错误。
错误 一个错误发生在评估一个报警规则。
NoData后 没有返回的数据至少在一个时间序列在一个规则的评估。

特别提醒NoData后错误

当评估一个报警规则产生的状态NoData后错误,Grafana报警将生成警报实例有以下额外的标签:

标签 描述
alertname 要么DatasourceNoDataDatasourceError根据不同的状态。
datasource_uid 数据源的UID导致状态。

你可以处理这些警报一样定期提醒通过添加一个沉默,通往一个接触点,等等。