我刚开始使用 srun 等命令。 我想使用 1 个节点 1cpu 和 16 个核心启动并行作业,但我不知道在使用 srun 函数时应该指示什么。 (1个节点由2个CPU组成,每个CPU有18个核心)
有人知道我应该使用哪些参数吗?
要将 CPU 资源的最小值设置为低于每个节点可用的 CPU 资源,您需要在
--cpus-per-task
命令中提供 srun
(请参阅 https://slurm.schedmd.com/srun.html#OPT_cpus-per-task )。
如果您想明确保留每个 CPU 的其他 2 个核心供系统使用,请参阅 https://slurm.schedmd.com/mc_support.html#srun_hints 了解
--cpu-bind
或高级资源限制的使用。