我们使用 GCP Composer 安装了 Airflow,但我们所有人突然网络服务器/调度程序都宕机了。
我们只是尝试通过更新一些虚拟变量或工作节点来重新启动,但总是出现以下错误
Error: UPDATE operation on this environment failed 1 hour ago with the following error message:
操作失败。无法启动composer-agent,这是一个更新 kubernetes 资源的 GKE 作业。请检查您的 GKE 集群是否存在、运行状况良好并且包含非空“default-pool”节点池。
任何建议,因为我们的环境完全卡住了
根据我的理解,由于 Google 私有访问 *.pkg.dev 的 DNS 记录不正确,composer 代理 pod 似乎无法提取容器映像。我相信您只会有 *.gcr.io 的记录,因为这是之前托管图像的地方更多信息here