我正在配置由SLURM控制的小型集群。
此集群具有一个主节点和两个分区。用户提交他们的工作工作者节点,我限制了他们对主节点的访问。群集中的每个分区专用于我们公司中的团队。
我希望不同团队的成员将他们的工作提交到不同的分区,而不必担心其他命令行开关。
也就是说,我希望srun
或sbatch
的默认分区根据运行这些命令的节点而有所不同。
例如:从主机worker1
提交的所有作业都应转到partition1
,并且从主机worker[2-4]
提交的所有作业都应转到partition2
。
并且sbatch
或srun
的所有调用都不应包含-p
(或--partition
)开关。
我尝试在不同计算机的default=YES
文件中的不同行上设置slurm.conf
,但这没有帮助。
这可以通过使用SLURM_PARTITION
和SBATCH_PARTITION
环境变量来解决,放在/etc/environment
文件中。
有关环境变量的详细信息,请参见sbatch
和srun
的手册页