如何计算K8S集群中Prometheus服务器Pod所需的持久卷大小？

Question

我将Prometheus掌舵图安装到kubernetes集群以进行监视。默认情况下，>

Prometheus服务器的永久卷大小定义为8Gi。
Prometheus服务器将在该卷中存储指标15天（保留期）

部署图表几天后，Prometheus服务器窗格已陷入崩溃回退状态。从pod日志中找到的原因是：

level=error ts=2019-10-09T11:03:10.802847347Z caller=main.go:625 err="opening storage failed: zero-pad torn page: write /data/wal/00000429: no space left on device"

这意味着磁盘（持久卷）中没有可用空间来保存数据。因此，我清除了该卷的现有数据并暂时解决了该问题。

对此有什么合适的解决方案？

Prometheus documentation说：

要计划Prometheus服务器的容量，可以使用粗略公式：

needed_disk_space = retention_time_seconds * ingested_samples_per_second * bytes_per_sample

有人可以解释如何故意使用此公式吗？

为什么8Gi大小在保留15天后还不够？

我将Prometheus掌舵图安装到kubernetes集群以进行监视。默认情况下，Prometheus服务器的永久卷大小定义为8Gi。 Prometheus服务器将度量标准存储在...

Answer 1

15天约为130万秒。让我们高估每个样本8个字节。因此，每个指标大约需要10mb。因此8GB可让您存储800个指标。您可能不止这些。将您要存储的系列数乘以10，即需要的兆字节数。大致来说，这至少会使您获得正确的数量级。

Answer 2

从Prometheus 2.7开始，您引入了一个新标记来管理保留。从文档：

如何计算K8S集群中Prometheus服务器Pod所需的持久卷大小？

问题描述投票：1回答：2

2个回答

最新问题

如何计算K8S集群中Prometheus服务器Pod所需的持久卷大小？

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2