根据sacct数据选择slurm作业

问题描述 投票:-1回答:2

在使用slurm的集群上,我正在尝试创建在特定时间间隔内提交的作业列表,以便我可以取消它们。

我可以手工使用:

sacct --format="JobID,Submit"

这将给我一个JobID列表和相应的提交时间,格式如下:

1919614      2019-04-02T19:31:30 
1919615      2019-04-02T19:31:32 
1919616      2019-04-02T19:31:33
1919686      2019-04-02T19:47:29 
1919687      2019-04-02T19:47:30 
1919688      2019-04-02T19:47:32 
1919689      2019-04-02T19:47:33 
1919690      2019-04-02T19:47:35 
1919691      2019-04-02T19:47:36

如何使用命令行从第一列中选​​择JobID,并在第二列的特定时间间隔内使用日期时间。

因此,例如给定一个区间{2019-04-02T19:47:30,2019-04-02T19:47:33}它应该给

1919687
1919688   
1919689

(或者有更好的方法来完成这项工作。)


我添加了awk标签,因为可以在不提供有关字符串来源的任何背景信息的情况下询问此问题。问题不仅仅是如果第二列是某个时间间隔内的日期,如何只打印第一列,这似乎应该可以使用awk

(我认为背景信息非常重要,以防有人使用不同的工具获得更好的解决方案。请参阅XY problem

linux awk hpc slurm
2个回答
2
投票

您的日期时间已经是可订购格式,因此您应该能够:

$ awk '$2 >= "2019-04-02T19:47:30" && $2 <= "2019-04-02T19:47:33" { print $1 }' file
1919687
1919688
1919689

如果你想让它更通用一点:

$ start="2019-04-02T19:47:30"
$ end="2019-04-02T19:47:33"
$ awk -v start=$start -v end=$end '$2 >= start && $2 <= end { print $1 }' file
1919687
1919688
1919689

0
投票

不需要awk,Slurm's sacct can do the filtering for you

sacct --state PD --starttime 019-04-02T19:47:30 --endtime 2019-04-02T19:47:33
© www.soinside.com 2019 - 2024. All rights reserved.