防止 GCP 维护重新启动 GKE 集群

问题描述 投票:0回答:2

GKE 集群似乎每周都会重新启动。我可以做些什么来防止这种情况发生吗?它确实将 Pod 迁移到其他节点,同时在其中一个节点上进行维护。但我不确定迁移过程中是否存在停机时间,有时 Pod 会陷入崩溃

crashloopbackoff
errimagepull
状态。

维护时如何进行迁移?当副本总数只有一个时,它是否会创建一个新的 Pod,然后路由流量,然后删除旧的 Pod?只是想知道是否有停机时间。由于是新集群,监控尚未设置,不知道维护期间玩家是否遇到宕机情况。

有没有办法阻止GCP进行维护?我使用 terraform 创建集群,因此如果我可以阻止它,我需要通过 terraform 来完成它,因为无法使用 GCP 控制台编辑 GKE 节点。

kubernetes google-cloud-platform google-kubernetes-engine
2个回答
4
投票

您可以配置维护时段并启用/禁用自动节点升级。

以下是 GCP 控制台中的配置选项示例:

您还可以决定您想要的发布渠道(快速、定期和稳定)。

如果您有区域集群,您的 Kubernetes 控制平面将会停机。只有区域集群复制控制平面。

就您自己的应用程序而言,它们应该具有零停机时间,并且当 Pod 准备好接收流量时,GKE 将自动创建新节点并转移流量。


0
投票

我遇到了类似的问题,节点会随机重新启动。结果我必须部署一个新的节点池,并将“紧凑放置”设置为“关闭”。 紧凑的布局不允许在发生维护事件时实时迁移节点。相反,相关节点将被终止并重新启动。

© www.soinside.com 2019 - 2024. All rights reserved.