为什么 cAdvisor 指标中容器内存使用量翻倍？

Question

我测试了这些查询。第一个查询的值是第二个查询的一半：

sum(container_memory_working_set_bytes{image!="",name=~"^k8s_.*",pod=~"$pod"}) by (pod)

和

sum (container_memory_working_set_bytes{pod=~"$pod"}) by (pod)

为什么写

image! = "", name = ~ "^ k8s_. *"

价值减半？

Answer 1

那是因为

cAdvisor

从

cgroups

获取这些值。 cgroup 的结构看起来像一棵树，每个 pod 都有分支，每个 pod 中的每个容器都有子 cgroup。就是这个样子(

systemd-cgls

):

├─kubepods
│ ├─podb0c98680-4c6d-4788-95ef-0ea8b43121d4
│ │ ├─799e2d3f0afe0e43d8657a245fe1e97edfdcdd00a10f8a57277d310a7ecf4364
│ │ │ └─5479 /bin/node_exporter --path.rootfs=/host --web.listen-address=0.0.0.0:9100
│ │ └─09ce1040f746fb497d5398ad0b2fabed1e4b55cde7fb30202373e26537ac750a
│ │   └─5054 /pause

每个 cgroup 的资源值是 其所有子级的累积值。这就是内存利用率加倍的方法，您只需总结其中每个容器的 pod 总消耗量。

如果您在 Prometheus 中执行这些查询，您会注意到重复的值：

{pod="cluster-autoscaler-58b9c77456-krl5m"} 59076608
{container="POD",pod="cluster-autoscaler-58b9c77456-krl5m"} 708608
{container="cluster-autoscaler",pod="cluster-autoscaler-58b9c77456-krl5m"}  58368000

第一个是父cgroup。如您所见，它没有

container

标签。此示例中的另外两个是暂停容器和实际应用程序。结合它们的值，您将得到父 cgroup 的值：

>>> 708608 + 58368000 == 59076608
True

有多种方法可以解决该问题。例如，您可以使用

container!=""

标签过滤器排除没有容器名称的指标。

解决此问题的另一种（更困难）方法是删除

metric_relabel_configs

中的累积指标。 IE。您可以编写一个重新标记规则，该规则将删除没有容器名称的指标：

- source_labels: [container, __name__, pod]
  regex: ";container_.+;.+"
  action: drop

您可以在此处

使用此重新标记规则

小心这个，您可能会意外删除所有非 cadvisor 指标。

为什么 cAdvisor 指标中容器内存使用量翻倍？

问题描述投票：0回答：1

1个回答

最新问题

为什么 cAdvisor 指标中容器内存使用量翻倍？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1