当我运行命令
nvidia-smi
时,我得到以下两个按总线 ID 排序的 GPU:
对于 GPU 0,00000000:0A:00.0
对于 GPU 1,00000000:41:00.0
但是,当我运行
NVIDIA X server Settings
时,我可以获得按总线 ID 排序的以下 GPU:
对于 GPU 0、PCI:65:0:0
对于 GPU 1、PCI:10:0:0
因此,他们根据自己的方式枚举 Bus-Id,有不同的顺序。 有什么办法可以让订单一致吗
操作系统:Ubuntu 16.04 主板:微星 X399(适用于 AMD 1950X)
(PS) 事实上,当我在多个 GPU 上使用dataparallel机制进行深度学习时,我的电脑就被冻结了。我猜GPU顺序不同就是原因。
重要的顺序是 CUDA 顺序。
您可以枚举 CUDA 设备并查看哪个是哪个。
CUDA_VISIBLE_DEVICES
、cudaSetDevice()
或 cuCtxCreate()
在未用于显示的 GPU 上运行程序
nvidia-smi
使用 GPU 在启动时向驱动程序注册的顺序。 CUDA 使用最快优先。