我正在尝试在使用 Ubunutu 22.04(WSL) 的单个节点上设置 slurm。我按照https://drtailor.medium.com/how-to-setup-slurm-on-ubuntu-20-04-for-single-node-work-scheduling文章中的步骤进行了配置-6cc909574365.
设置后,我可以在
sinfo
命令的输出中看到节点,但是节点的状态最初设置为 inval
,我尝试使用命令 idle
将其更新为 sudo scontrol update nodename=localhost state=idle
,但是此命令始终失败并返回错误 slurm_update error: Invalid node state specified
。
这是我的 slurm.conf 文件 https://gist.github.com/kmoza/11c6a9cdef085bb14d9947b63ba95ef0 我已配置的参数。
当 Slurm 在节点上找不到它期望从
slurm.conf
文件中找到的资源时,通常会出现这种情况。
比较配置中的线路
RealMemory=8135080 State=UNKNOWN SocketsPerBoard=1 CoresPerSocket=8 ThreadsPerCore=2
输出为
slurmd -C
。
同样在这种情况下,
slurmctld
的日志应该明确说明这一点。