nvidia-smi 和 nvidia x 服务器设置之间的顺序不同

问题描述 投票:0回答:2

当我运行命令

nvidia-smi
时,我得到以下两个按总线 ID 排序的 GPU:

对于 GPU 0,00000000:0A:00.0

对于 GPU 1,00000000:41:00.0

但是,当我运行

NVIDIA X server Settings
时,我可以获得按总线 ID 排序的以下 GPU:

对于 GPU 0、PCI:65:0:0

对于 GPU 1、PCI:10:0:0

因此,他们根据自己的方式枚举 Bus-Id,有不同的顺序。 有什么办法可以让订单一致吗

操作系统:Ubuntu 16.04 主板:微星 X399(适用于 AMD 1950X)

(PS) 事实上,当我在多个 GPU 上使用dataparallel机制进行深度学习时,我的电脑就被冻结了。我猜GPU顺序不同就是原因。

ubuntu cuda gpu nvidia pci-e
2个回答
1
投票

重要的顺序是 CUDA 顺序。

您可以枚举 CUDA 设备并查看哪个是哪个。

然后,您将能够使用

CUDA_VISIBLE_DEVICES
cudaSetDevice()
cuCtxCreate()

在未用于显示的 GPU 上运行程序

0
投票

nvidia-smi
使用 GPU 在启动时向驱动程序注册的顺序。 CUDA 使用最快优先。

© www.soinside.com 2019 - 2024. All rights reserved.