我很好奇是否有办法设置Slurm分区,以便调度程序将查询可用分区并根据请求的资源量分配给分区,例如。说我有几个队列:
small_cpu = node1,2,3 <- assigned when requesting <= 10 cores
large_cpu = node4,5,6 <- assigned when requesting > 10 cores
big_mem = node7,8,9 <- assign when requesting > 100GB memory
fail/backfill = nodes10,11,12 <- assigned when the other queues are full
我能够在PBS / Moab中做到这一点,但是我很难用Slurm文档试图找出它。任何见解都表示赞赏。
中号
在Slurm中执行该操作的方法是使用作业提交插件,该插件允许您将作业路由中的任何逻辑合并到分区(以及更多)。
查看示例here。