Slurm SBATCH 不保存所有系统输出所有作业失败

问题描述 投票:0回答:0

我正在使用 Slurm 在集群上运行需要大内存的作业。我使用标志

--output
来保存系统输出。如果作业完成且没有错误,这将成功保存系统输出。 但是,如果作业在节点上遇到内存不足问题,则在错误发生之前的任何系统输入都不会出现在
output.log
文件中。所以
output.log
只会包含错误发生后的系统输出。

Slrum 有没有办法在作业失败时将所有系统输出保存到

output.log
,以便我可以看到作业中发生错误的时间点?

这是我正在使用的批处理脚本:

#!/bin/bash -l
#SBATCH --account=qmech
#SBATCH --job-name=job
#SBATCH --exclusive
#SBATCH -C mem768
#SBATCH --mem=750gb
#SBATCH -c 32 # CPU per task
#SBATCH --time=01:00:00
#SBATCH --output=output.log
#SBATCH --error=error.log

我查看了 Slurm 文档,但不知道有任何参数可以实现这一点。

slurm sbatch
© www.soinside.com 2019 - 2024. All rights reserved.