Slurm异构工作组正在保留整个分配

问题描述 投票:0回答:1

我正在启动Slurm中的heterogenous job group,其中我的Slurms脚本类似于:

#!/bin/bash
srun --pack-group 0 short-process &
srun --pack-group 1 long-process &
wait

我的提交摘要看起来像:

sbatch --mem-per-cpu = 4g --ntasks = 1:--mem-per-cpu = 2g --ntasks 1 mybash.sh

我希望在完成短流程后会释放其分配,但是当我运行sacct时,我看到两个包组都被列为正在运行,尽管包组0的第一步运行被列为COMPLETE。

是否有一种方法可以使完成分配后的发行者释放短代码?

slurm
1个回答
0
投票

例如,您必须使用scancel $SLURM_JOB_ID+0明确地执行此操作才能取消pack-group 0。

#!/bin/bash
{ srun --pack-group 0 short-process ; scancel $SLURM_JOB_ID+0 ; } &
srun --pack-group 1 long-process &
wait
© www.soinside.com 2019 - 2024. All rights reserved.