我如何在工作完成时(在提交脚本中)获得slurm工作状态(例如:COMPLETED, FAILED, TIMEOUT, ...)?我想单独跟踪那些超时失败的工作。
目前我使用退出代码工作,但是TIMEOUT的作业也得到退出代码0。
为了便于以后参考,我最后是这样做的。
在工作开始时检索jobid,并将一些信息(例如:)写入摘要文件。"${SLURM_JOB_ID} ${PWD}"
)到一个摘要文件中。
然后处理这个文件,并使用类似 sacct -X -n -o State --j ${jid}
以获得工作状态。