slurm 相关问题

SLURM是一个开源资源管理器,专为各种规模的Linux集群而设计。

在 bash 中使用 awk 计算 sacct 输出中的列

我在一个 slurm 集群上工作,我想知道我当前使用了多少 cpu 和内存。我的主要问题是区分 8G 和 8Gc 的内存使用情况。 (前者是原始所需的内存...

回答 1 投票 0

Slurm 脚本来错开进程的启动

我想知道如何在 Slurm 中使用 --begin 命令来错开每个数组元素的开始。 我尝试了以下代码: #!/bin/bash -l #SBATCH --time=48:00:00 #SBATCH --ntasks=1 #SBATCH ...

回答 0 投票 0

OSU 基准在容器中使用 UCX 时完成后挂起打印结果

我正在尝试使用 UCX 来提供更多具有性能的便携式 MPI 应用程序容器。所以我想比较使用 UCX 替换方法,即挂载系统将 UCX 构建到容器中......

回答 0 投票 0

Snakemake 和 GROMACS 之间的冲突?

我试图尽可能地简化我的问题,但仍然出现错误。 整个想法是我想执行(在更复杂的工作流程中)命令: gmx mdrun -nt 12 -deffnm em...

回答 0 投票 0

slurm:优先考虑需要较少系统资源的作业

如何为需要较少系统资源的 Slurm 作业提供高优先级?假设系统资源仅基于 CPU 和内存使用情况。 我查看了 Slurm 文档并提出问题......

回答 0 投票 0

如何在 SLURM 上正确设置 Snakemake?

管理员暂时阻止了我,因为我的作业正在登录节点上运行。我不确定我是否正在设置 SLURM 配置文件并正确调用 Snakemake,因为我遇到了一些问题......

回答 1 投票 0

检查运行作业的sbatch脚本

从 sbatch 脚本运行 slurm 作业时,是否有命令可以让我查看用于启动该作业的 sbatch 脚本中的内容? 例如 sacct 告诉我我在 SLURM_JOB_ID.3 上...

回答 2 投票 0

未调用函数中的代码导致 MPI 程序在跨节点时失败

我正在使用mpiP来跟踪MPI程序,并对mpiP进行一些修改。我想记录MPI函数参数信息,所以我创建了一个缓冲区。 我在下面的 mpiPi.h 中添加了一个 list_t 结构: 类型定义

回答 0 投票 0

在 Slurm/Sbatch 中同时对多个输入文件运行相同的 python 脚本

我正在尝试制作一个在数十/数百个输入文件上运行 python 脚本的 slurm 文件。每个进程都是单线程的,彼此完全独立,我想通过 r... 加快速度

回答 2 投票 0

在 slurm 集群中运行脚本时如何修复 perl 语言环境设置错误?

我想运行一个名为 trinity 的程序,该程序使用我研究所的高性能集群部分用 perl 编写。我使用 conda 来安装 trinity 并尝试通过提交 ...

回答 1 投票 0

如何解决 SLURM 的这些错误?

#SBATCH -J myjob # 作业名称 #SBATCH -o myjob.o%j # stdout输出文件名(%j对应job id) #SBATCH -e myjob.e%j # 名字...

回答 0 投票 0

slurmd: error: Couldn't find the specified plugin name for cgroup/v2 looking all files

我在计算节点上启动 slurmd 服务时遇到问题。 × slurmd.service - Slurm 节点守护进程 已加载:已加载(/usr/lib/systemd/system/slurmd.service;已启用;供应商预设:已禁用) 交流...

回答 2 投票 0

Slurm 作业输出文件

我正在运行多个作业,试图获得更好的性能结果。为此,我正在生成一个 UUID 并需要输出的文件名来包含此 UUID。 目前,我正在定义名称...

回答 1 投票 0

为什么我在使用 sbatch SLURM 时一直收到 NonZeroExitCode?

我有一个简单的 test.ksh,我正在使用以下命令运行它: 分批测试.ksh 我不断收到“JobState=FAILED Reason=NonZeroExitCode”(使用“scontrol show job”) 我已经确定了

回答 2 投票 0

SLURM 作业数组中不同作业的时间不同

考虑以下示例 .sh 文件,尝试使用 SLURM 安排一些作业 #!/bin/庆典 #SBATCH --account=exacct #SBATCH --time=02:00:00 #SBATCH --job-name="ex_job" #SBATCH --arr ...

回答 0 投票 0

SLURM - 强制 MPI 在不同的物理 CPU 上安排不同的等级

我正在 SLURM 下的 8 节点集群上运行实验。每个 CPU 有 8 个物理内核,并且具有超线程能力。运行程序时 #SBATCH --nodes=8 #SBATCH --ntasks-per-node...

回答 1 投票 0

如何判断我的程序是否在核心和/或线程上运行(slurm/mpirun,htop)

我正在尝试在 48 个内核上运行并行化 (OpenMPI) 程序,但无法明确判断我是真正在内核上运行还是在线程上运行。我正在使用 htop 来尝试照亮核心/

回答 0 投票 0

从不同但匹配的子目录提交多个 slurm 作业的脚本

最近我一直在生成几个系列的输入文件,以使用 Slurm 排队系统在 HPC 上运行计算。这些计算都放在 D001、D002 等形式的子目录中....

回答 2 投票 0

如何在 SLURM 中分配内存?

我是 Slurm 的新手。下面,我想执行一个 Python 文件,它需要 92.3GiB。我分配了 120GB,但我的代码仍然返回内存错误。 提交_venv.sh #/bin/庆典 #SBATCH --account=melchua #SBAT...

回答 2 投票 0

Slurm SBATCH 不保存所有系统输出所有作业失败

我正在使用 Slurm 在集群上运行需要大内存的作业。我使用标志 --output 来保存系统输出。如果作业完成,这将成功保存系统输出...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.