我们有一个带有自动升级节点的 GKE 集群。我们最近注意到一个节点变得不可调度并最终被删除,我们怀疑该节点正在为我们自动升级。有没有办法在 Stackdriver 中确认(或以其他方式)这确实是发生的原因?
您可以将以下高级日志查询与 Cloud Logging(以前称为 Stackdriver)结合使用来检测节点池的升级:
protoPayload.methodName="google.container.internal.ClusterManagerInternal.UpdateClusterInternal"
resource.type="gke_nodepool"
和大师:
protoPayload.methodName="google.container.internal.ClusterManagerInternal.UpdateClusterInternal"
resource.type="gke_cluster"
此外,您可以使用维护窗口控制何时应用更新(如用户 aurelius 提到的)。
我知道这不是 Cloud Logging,但列出自动升级操作的另一种方法是使用 gcloud。在云日志中我只能看到升级完成,没有看到开始。
gcloud container operations list
只是为了给帖子添加更多价值,您可能会在此处
找到不同的 GKE 相关示例日志查询我想你的问题已经在评论中得到了解答。正如 GKE 团队自行决定定期进行额外的自动升级一样。要获得更多控制,您可以创建维护窗口,如此处所述。这基本上是您选择应进行自动升级的时间范围。