如何获得已完成的PBS或Torque工作的信息?

问题描述 投票:2回答:4

我有已完成工作的ID。如何查看其详细信息,例如执行时间,分配的节点等?我记得SGE有一个命令(qacct?)。但我找不到PBS或Torque。谢谢。

shell pbs torque
4个回答
4
投票

由于作业记帐需要root访问权来查看已完成的作业,或者集群管理员已经安装了pbstools(两者都不受用户控制),我发现最简单的方法是放置一个

tracejob $PBS_JOBID

在提交脚本的最后一行。如果调度程序是MAUI,那么checkjob -vv $PBS_JOBID是另一种选择。这些命令可以重定向到单独的outfile:

tracejob $PBS_JOBID > $PBS_O_WORKDIR/$PBS_JOBID.tracejob

也应该可以将此作为用户epilog脚本运行,以使其在作业之间更加可重用。


0
投票

现在,在TORQUE中获得此功能的唯一方法是查看会计日志。您可以grep查找作业ID并查看作业的记帐记录,如下所示:

04/30/2014 15:20:18;Q;5000.bob;queue=batch 04/30/2014 15:33:00;S;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0 04/30/2014 15:36:20;E;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0 session=22933 end=1398893780 Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=2580kb resources_used.vmem=37072kb resources_used.walltime=00:03:20

不幸的是,要直接执行此操作,您必须具有root访问权限。为了解决这个问题,有一些工具,如pbsacct,有助于更好地浏览这个。 pbsacct是pbstools包的一部分,这是该链接带你的地方。


0
投票

对于Torque,您可以使用“tracejob”命令检查至少部分信息。

官方文件:

http://docs.adaptivecomputing.com/torque/Content/topics/11-troubleshooting/usingTracejobToLocateFailures.htm

您应该注意的一件事是,此工具是一种解析日志的便利。默认情况下,它只会检查最后一天。请务必阅读“-n”选项的文档。


0
投票

在基于扭矩的系统上。我发现从作业中获取统计信息的最佳方法是将其添加到提交的作业脚本的末尾。输出将添加到STDOUT文件中。

qstat -f -1 $ PBS_JOBID

© www.soinside.com 2019 - 2024. All rights reserved.