我是 SLURM 新手。我通常喜欢以交互方式运行作业,而不是使用
SBATCH
。这就是我请求资源的方式 -
srun --time=10:00:00 --nodes=1 --cpus-per-task=16 --mem=64G --partition=gpu --gres=gpu:2 --pty /usr/bin/bash
此外,我还可以通过执行 -
找到分配资源的作业 IDsqueue -u <my_username>
我想获取正在消耗的 GPU 内存、活动 CPU 数量等的实时统计数据。有什么办法可以做到这一点吗?
我已经检查过诸如this之类的问题。然而,他们没有回答我的问题。
如果我的问题需要进一步澄清,请告诉我。