AKS Pod 内存不足

问题描述 投票:0回答:1

我遇到一个问题,在 AKS 中,我的 POD 由于峰值而内存不足,即消息包含大量数据,然后它会使 POD 关闭。我有多个 POD 正在运行,因此执行会转移到下一个 POD,但它也会下降,因为它具有相同的内存量,因此整个应用程序会因为 1 个峰值而下降。 我想知道一种在第一个 POD 由于内存不足问题而下降时自动调整下一个 POD 内存的方法。 让我知道您的想法,我们如何解决这个过程。

我浏览了 AKS 文档。它确实提供了自动缩放的选项,但是我没有看到自动缩放指标的选项,例如CPU、内存等

azure out-of-memory azure-aks azure-automation
1个回答
0
投票

在 Kubernetes 中,基于资源消耗的自动缩放通常与 HPA 配合使用,如果同一组 pod 的资源消耗较高,则可以扩展到更多 pod,或者使用 VPA 来监控更高使用率时增加 pod 规格的资源。 HPA 默认在 AKS 中工作,VPA 插件处于预览状态(尽管您始终可以使用 helm 安装它)。

AKS 中的

“自动缩放器”通常表示集群自动缩放器,主要工作是当 Pod 由于没有可调度的节点而陷入挂起状态时填充新的 nodes。它与 HPA 结合使用效果很好。即,HPA 扩展新的 pod --> 处于待处理状态的 pod --> 集群自动缩放器扩展新节点以使 pod 落地。

在出现峰值的情况下,下一个问题是违规工作负载需要多少内存。 VPA 在这方面可能表现良好,因为它可以在 pod 被 oomkilled 时增加内存请求。这在“未知”工作负载中相当有用,但我可以想象在某些情况下救援可能不会及时到来,具体取决于应用程序的时间要求。

可以采取的另一种方法是使用相当慷慨的限制并通过监控进行观察,然后随着项目的进展逐渐降低内存限制。

希望这有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.