如何找到已完成的 SLURM 作业的排队时间?

问题描述 投票:0回答:2

我正在尝试找到一种方法来查看已完成作业的等待时间,直到它们在使用 SLURM 作为工作负载管理器的集群上启动为止。

我知道“sacct”命令可以打印有关已完成作业的大量信息,但我没有发现任何对我的任务有用的信息。

完美的是:

  • 作业排队直到开始的时间
  • 我提交作业的时间戳或日期(然后我可以计算出等待时间,因为“sacct”通过“Start”字段提供了有关作业开始时间的信息)

你有什么有用的建议吗?

cluster-computing slurm sbatch sacct
2个回答
6
投票

作业的排队时间可以通过

sacct
命令获取,如下所示:

sacct -X  -j <jobid> -o Reserved

Reserved
列是(来自 sacct 手册页

保留 多少挂钟时间被用作这项工作的预留时间。这是根据作业从合格时间到实际开始等待的时间得出的。格式与 Elapsed 相同。

请注意,这与 Slurm 中所谓的“高级资源预留”无关。

基本上,“提交”作业的时间和该作业“符合资格”的时间通常是相同的,但在某些情况下除外,例如使用

--hold
--dependency
提交作业时。

UPADTE:最新版本的 Slurm 将此参数命名为

Planned

这项工作的计划时间使用了多少挂钟时间。这是从如何得出的 作业从符合条件的时间到开始或取消的等待时间。格式为 与已过去相同。


4
投票

sacct
命令具有:
sacct -o start,submit
应该提供您需要的所有信息。

© www.soinside.com 2019 - 2024. All rights reserved.