无法将 slurm 节点状态从无效更改为空闲

问题描述 投票:0回答:1

我正在尝试在使用 Ubunutu 22.04(WSL) 的单个节点上设置 slurm。我按照https://drtailor.medium.com/how-to-setup-slurm-on-ubuntu-20-04-for-single-node-work-scheduling文章中的步骤进行了配置-6cc909574365.

设置后,我可以在

sinfo
命令的输出中看到节点,但是节点的状态最初设置为
inval
,我尝试使用命令
idle
将其更新为
sudo scontrol update nodename=localhost state=idle
,但是此命令始终失败并返回错误
slurm_update error: Invalid node state specified

这是我的 slurm.conf 文件 https://gist.github.com/kmoza/11c6a9cdef085bb14d9947b63ba95ef0 我已配置的参数。

slurm hpc
1个回答
0
投票

当 Slurm 在节点上找不到它期望从

slurm.conf
文件中找到的资源时,通常会出现这种情况。

比较配置中的线路

RealMemory=8135080 State=UNKNOWN SocketsPerBoard=1 CoresPerSocket=8 ThreadsPerCore=2

输出为

slurmd -C

同样在这种情况下,

slurmctld
的日志应该明确说明这一点。

© www.soinside.com 2019 - 2024. All rights reserved.