Kafka Consumer 滞后的 Prometheus 警报规则

问题描述 投票:0回答:1

我想跟踪是否有任何应用程序停止使用 kafka 主题。为此,我在警报管理器中添加了 Kafka Consumer 滞后警报规则,只要条件满足,该规则就会在 Slack 通道上发送警报。

我正在做,

group by (consumergroup) and sum the metric and if value > 0
然后发送警报。这工作正常,但由于主题数量高低,频道中充斥着警报。

我想添加警报规则,它可以处理高容量和低容量主题 Kafka Consumer 滞后。

我还参考了 - https://gist.github.com/Andor/18fe55fd6e08ec130988ef373473185e#file-kafka-lag-yaml-L28 但值是硬编码的。这在 Kafka 主题量较小的情况下无法工作。

同时处理高容量和低容量主题 Kafka Consumer 滞后的规则是什么?

apache-kafka alert prometheus kafka-consumer-api prometheus-alertmanager
1个回答
0
投票

触发器:如果在{interval}期间消费者完全处理滞后所需的时间超过Kafka主题中的{消息存储时间},则会触发警报

© www.soinside.com 2019 - 2024. All rights reserved.