等待所有给定名称的LSF作业,优先于JOB_DEP_LAST_SUB = 1

问题描述 投票:0回答:1

[我有一个很大的计算任务,由几步组成,我在由LSF管理的PC群集上运行。

此任务的一部分包括启动多个具有相同名称的并行作业。作业有些不同,因此很难将它们转换为作业数组。

此计算的下一步是对这些作业进行汇总,因此,结果必须等待所有这些完成为止。

我像往常一样,尝试将-w ended(job-name)命令行开关用于bsub,以指定作业依赖性。

但是,群集的管理员已在lsb.params中设置了JOB_DEP_LAST_SUB = 1

根据LSF manual,这使LSF仅等待一个具有提供名称的最新作业完成,而不是等待所有作业。

是否有可能仅在不要求管理员重新配置整个群集的情况下才对我的任务覆盖此行为(此群集被许多人使用,他们不太可能同意)?

我在手册中找不到任何线索。

distributed-computing lsf
1个回答
0
投票

似乎无法覆盖它。

我已经通过添加随机值来更改作业名称以使其唯一,然后将条件更改为-w ended(job-name-*)

© www.soinside.com 2019 - 2024. All rights reserved.