我正在尝试找到一种方法来查看已完成作业的等待时间,直到它们在使用 SLURM 作为工作负载管理器的集群上启动为止。
我知道“sacct”命令可以打印有关已完成作业的大量信息,但我没有发现任何对我的任务有用的信息。
完美的是:
你有什么有用的建议吗?
作业的排队时间可以通过
sacct
命令获取,如下所示:
sacct -X -j <jobid> -o Reserved
Reserved
列是(来自 sacct 手册页)
保留 多少挂钟时间被用作这项工作的预留时间。这是根据作业从合格时间到实际开始等待的时间得出的。格式与 Elapsed 相同。
请注意,这与 Slurm 中所谓的“高级资源预留”无关。
基本上,“提交”作业的时间和该作业“符合资格”的时间通常是相同的,但在某些情况下除外,例如使用
--hold
或 --dependency
提交作业时。
UPADTE:最新版本的 Slurm 将此参数命名为
Planned
:
这项工作的计划时间使用了多少挂钟时间。这是从如何得出的 作业从符合条件的时间到开始或取消的等待时间。格式为 与已过去相同。
sacct
命令具有:sacct -o start,submit
应该提供您需要的所有信息。