我正在使用 SLURM 在超级计算机上调度作业。我已设置
--output=log.out
选项将作业标准输出中的内容放入文件中 (log.out
)。我发现该文件每 30-60 分钟更新一次,这让我很难检查我的工作状态。
知道为什么更新这个文件需要这么长时间吗?有没有办法更改设置以便更频繁地更新此文件?
使用SLURM 14.03.4-2
这可能与缓冲有关。
您是否尝试过按照此处中的建议禁用输出缓冲?我推荐 stdbuf 选项:
stdbuf -o0 -e0 command
但是如果没有更多信息就无法确定,因为我从未经历过这样的行为。您使用哪个文件系统?
此外,如果您使用 srun 来运行命令,您可以使用
--unbuffered
选项来禁用输出缓冲。