我从官方文档 docker desktop 全新安装了 docker desktop。 然后我按照官方文档nvidia container toolkit安装了NVIDIA Container Toolkit。 当我以非 root 权限运行 docker 时:
docker run --rm --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
它给出了以下错误:
docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: load library failed: libnvidia-ml.so.1: cannot open shared object file: no such file or directory: unknown.
如果我使用sudo权限,错误是没有发生。另外,如果我运行一个非 gpu 容器(没有 --gpu all 选项)也很好。
我试过几个建议:
sudo chmod 666 /dev/nvidia*
sudo chmod 666 /dev/nvidia-uvm*
sudo chown root:video /usr/local/nvidia/lib64/libnvidia-ml.so.1
sudo chmod 664 /usr/local/nvidia/lib64/libnvidia-ml.so.1
我现在真的很绝望。有没有人有什么建议?任何帮助将不胜感激。