无法在GPU(本地)上运行笔记本,在ranchers k3s集群上运行kubeflow

问题描述 投票:0回答:1

我已经在 k3s 集群上安装了 kubeflow。 我已将集群配置为能够访问 GPU,并且它对于 GPU 上的测试 Pod 运行良好,并且我可以在 Pod 上看到 nvidia-smi 输出。

但是,我希望从 kubeflow 仪表板创建的笔记本在 GPU 上运行,我找不到任何可以做到这一点的信息。我已在仪表板上的笔记本创建中从 UI 中选择了 GPU,但在运行 jupyter 笔记本时,以下命令仍返回 false:

torch.cuda.is_avaiable()
返回
False

对于 k3s,我们需要在 pod 规格中添加

"runtimeClassName: nvidia"
,但我无法在 kubeflow 清单中执行此操作。 如果我遗漏了什么,请给我建议或指导我。

提前致谢。

jupyter-notebook nvidia rancher k3s kubeflow
1个回答
0
投票

我通过将 nvidia 设置为默认运行时解决了这个问题。在本地机器上使用 GPU 运行它:

sudo nvidia-ctk 运行时配置 --runtime=containerd --nvidia-set-as-default

sudo systemctl 重新启动容器

sudo systemctl 状态容器

© www.soinside.com 2019 - 2024. All rights reserved.