我正在一个基于SLURM的集群上工作,我想知道是否存在一个命令(或一个配置文件),我可以以用户身份运行,以了解我被允许同时运行的最大作业数量(我在Slurm文档中没有找到它)。有这样的命令吗?
你应该查看的资源限制是 MaxJobs
.
如下文所解释: 文献它可以通过多种方式进行设置。按用户关联、按账户(用户组)、按集群。也可以直接通过关联或通过服务质量(QOS)来设置。
你应该首先检查哪些账户与你的用户相关联,例如,与 sacctmgr list user $USER
.
然后,你可以检查 MaxJobs
与 sacctmgr list associations
. 查看你的账户(靠近列表顶部)和你的用户。
最后,检查用QOS设置的值,用 sacctmgr show qos
(寻找 MaxJobsPU
和 MaxJobsPA
,每个用户和每个账户IIRC)。)