我遇到了一个小问题,找不到解决方案。
Grafana 有一个按需构建的仪表板
rate(http_request_duration_seconds_sum{handler="/createmag",method="POST",status="200"}[$__rate_interval]) /rate(http_request_duration_seconds_count{handler="/createmag",method="POST",status="200"}[$__rate_interval])
您需要发出警报。现在请求的第一部分是以秒为单位的创建时间,第二部分是请求本身的数量。
Alert 应该是这样的形式,如果持续超过 3 秒的创建次数超过 15 分钟内创建总数的 5% - 则发出 Alert。 请告诉我,在哪里挖掘,在哪里寻找?
我尝试了很多选择,但都不一样。 增加(http_xxx_count[5m]) - 增加(http_xxx_bucket{le="3.0"}[5m])
您尝试过MetricsQL函数histogram_share吗?
histogram_share(3, http_request_duration_seconds_bucket) > 0.05
请尝试上面建议的查询^