我正在使用 Ansible playbook 在虚拟机上安装裸机单节点 Kubernetes 集群 作为虚拟化主机,我使用 ESXi 8.0 和 Hyper-V(在 Windows 11 上),操作系统是 RHEL 8.4,calico 是我使用的网络插件
问题是,在 ESXi 8.0 上虚拟机重新启动后,某些 Kubernetes Pod 未将就绪状态更改为 1/1,它始终为 0/1,但在 Hyper-V 上完全没有问题,所有 Pod 都是 1/1
NAMESPACE NAME READY STATUS RESTARTS AGE calico-apiserver calico-apiserver-558c58dd84-cgmvt 1/1 Running 4 (<invalid> ago) 6d3h calico-apiserver calico-apiserver-558c58dd84-r4x6z 1/1 Running 4 (<invalid> ago) 6d3h calico-system calico-kube-controllers-cc8f5d649-tnplf 1/1 Running 4 (<invalid> ago) 6d3h calico-system calico-node-cfhhs 1/1 Running 4 (<invalid> ago) 6d3h calico-system calico-typha-596b4b6967-5bv8t 1/1 Running 6 (<invalid> ago) 6d3h calico-system csi-node-driver-9x2bs 2/2 Running 8 (<invalid> ago) 6d3h default nfs-subdir-external-provisioner-6c5b8fff7-shkcg 1/1 Running 4 (<invalid> ago) 6d3h kube-system coredns-565d847f94-mqdjs 1/1 Running 4 (<invalid> ago) 6d3h kube-system coredns-565d847f94-s5wgl 1/1 Running 4 (<invalid> ago) 6d3h kube-system etcd-localhost.localdomain 0/1 Running 4 (<invalid> ago) 32m kube-system kube-apiserver-localhost.localdomain 0/1 CreateContainerError 4 (27m ago) 30m kube-system kube-controller-manager-localhost.localdomain 0/1 Running 4 (<invalid> ago) 6d3h kube-system kube-proxy-gvwmq 1/1 Running 4 (<invalid> ago) 6d3h kube-system kube-scheduler-localhost.localdomain 0/1 Running 4 (<invalid> ago) 6d3h tigera-operator tigera-operator-7b594b484b-pd8p6 1/1 Running 10 (24m ago) 6d3h
有人面临类似问题吗?如何在 ESXi 8.0 上修复该问题,使所有 Pod 均为 1/1
尝试其他 ESXi 版本(6.5、6.8、7.0),所有版本都有相同的错误
这不是 Kubernetes 问题。这是硬件/BIOS问题
通过使用 Dell Lifecycle Controller OS Deployment 安装 ESXi 解决了问题