SLURM支持在一个节点上同时运行多个作业吗?

问题描述 投票:0回答:2

我们的计算机集群运行的是 slurm 版本

15.08.13
,mpich 版本是
3.2.1
。我的问题是,Slurm可以支持在一个节点上同时运行多个作业吗?我们的计算机集群每个节点有 16 个核心 cpu。我们希望在一个节点上同时运行两个作业,每个作业使用 8 个核心。

我们发现,如果一个作业使用了一个节点的所有 cpu 核心,则该节点的状态将变为“已分配”。如果一个作业仅使用一个节点的部分 cpu 核心,则该节点的状态将变为“mixed”,但后续作业只能排队,且作业状态为“pending”。

我们提交作业的顺序如下:

 srun -N1 -n8 testProgram

那么,Slurm 是否支持在一个节点上同时运行多个作业?谢谢。

parallel-processing mpi cluster-computing slurm
2个回答
3
投票

是的,前提是它配置了

SelectType=select/cons_res
,但您的系统上似乎并非如此。您可以用
scontrol show config | grep Select
检查。请注意,在 Slurm 的最新版本中,
cons_res
已替换为
cons_tres
请参阅此处


1
投票

是的,您需要设置 SelectType=select/cons_res 或 SelectType=select/cons_tes 和 SelectTypeParameters=CR_CPU_Memory cons_res 和 cons_tes 的区别在于 cons_tres 增加了 GPU 支持。

© www.soinside.com 2019 - 2024. All rights reserved.