我们有两个Prometheus系统,一个是生产系统,一个是分期系统。在制作时,一些prometheus查询在通过Grafana查询时超时。 (花了超过1分钟)
我观察到的两个系统之间的一些差异是 -
Prod正在运行1.8.2版本的Prometheus,升级运行2.1.0 Prod拥有总计93亿个数据点,升级有13亿个。 Prod每5分钟摄取大约10k个样本,每5分钟进行一次6k。
问题 -
Prod每5分钟摄取大约10k个样本,每5分钟进行一次6k。
这将是一个小小的普罗米修斯,但你的数字不会加起来。在10k / 5m时,33 / s需要大约9年才能达到9.3B样品。我不认为你告诉我一切。
query_range性能是否取决于Prometheus中数据的大小或摄取率?
数据的大小。
当我们使用更高的步长/更低的分辨率时查询工作,但我们确实需要1秒的粒度来进行一些比较。当我们迁移到Prometheus 2.1.0时,查询性能会提高吗?
这正在进行分析,这可能是与指标有关但很棘手。