运行“sinfo ... --Format=GresUsed”等命令时如何解释 GresUsed 的输出格式
我的节点的输出看起来像这样:
GPU:h100:0(IDX:不适用)
所有这些意味着“0(IDX:N/A)”
这意味着当前没有任何已配置的 GPU h100 类型的 GRES 分配给该节点的作业:
gpu:h100:0(IDX:N/A)
^ ^ ^ ^
| | | |
| | | + Indices of the allocated GPUs (here None Available (N/A) )
| | + Number of allocated GPUs (here 0)
| + GPU type (here Nvidia Tesla H100)
+ GRES type (here gpu)
在具有多个 GPU(其中使用了 4 个 GPU)的节点上,它看起来像这样:
gpu:h100:4(IDX:0-3)