在使用slurm的集群上,我正在尝试创建在特定时间间隔内提交的作业列表,以便我可以取消它们。
我可以手工使用:
sacct --format="JobID,Submit"
这将给我一个JobID列表和相应的提交时间,格式如下:
1919614 2019-04-02T19:31:30
1919615 2019-04-02T19:31:32
1919616 2019-04-02T19:31:33
1919686 2019-04-02T19:47:29
1919687 2019-04-02T19:47:30
1919688 2019-04-02T19:47:32
1919689 2019-04-02T19:47:33
1919690 2019-04-02T19:47:35
1919691 2019-04-02T19:47:36
如何使用命令行从第一列中选择JobID,并在第二列的特定时间间隔内使用日期时间。
因此,例如给定一个区间{2019-04-02T19:47:30,2019-04-02T19:47:33}
它应该给
1919687
1919688
1919689
(或者有更好的方法来完成这项工作。)
我添加了awk标签,因为可以在不提供有关字符串来源的任何背景信息的情况下询问此问题。问题不仅仅是如果第二列是某个时间间隔内的日期,如何只打印第一列,这似乎应该可以使用awk
(我认为背景信息非常重要,以防有人使用不同的工具获得更好的解决方案。请参阅XY problem)
您的日期时间已经是可订购格式,因此您应该能够:
$ awk '$2 >= "2019-04-02T19:47:30" && $2 <= "2019-04-02T19:47:33" { print $1 }' file
1919687
1919688
1919689
如果你想让它更通用一点:
$ start="2019-04-02T19:47:30"
$ end="2019-04-02T19:47:33"
$ awk -v start=$start -v end=$end '$2 >= start && $2 <= end { print $1 }' file
1919687
1919688
1919689
不需要awk,Slurm's sacct can do the filtering for you:
sacct --state PD --starttime 019-04-02T19:47:30 --endtime 2019-04-02T19:47:33