工作完成退出时的SLURM状态字符串

问题描述 投票:0回答:1

我如何在工作完成时(在提交脚本中)获得slurm工作状态(例如:COMPLETED, FAILED, TIMEOUT, ...)?我想单独跟踪那些超时失败的工作。

目前我使用退出代码工作,但是TIMEOUT的作业也得到退出代码0。

bash slurm exit-code
1个回答
1
投票

为了便于以后参考,我最后是这样做的。

在工作开始时检索jobid,并将一些信息(例如:)写入摘要文件。"${SLURM_JOB_ID} ${PWD}")到一个摘要文件中。

然后处理这个文件,并使用类似 sacct -X -n -o State --j ${jid} 以获得工作状态。

© www.soinside.com 2019 - 2024. All rights reserved.