slurm 相关问题

SLURM是一个开源资源管理器,专为各种规模的Linux集群而设计。

我如何向sbatch中的包装命令发送超时信号?

我有一个程序,当它收到SIGUSR1时,将写一些输出并退出。我试图让sbatch在超时之前通知该程序。我使用以下命令使程序入队:sbatch -t 06:00:00 --...

回答 1 投票 1

在Slurm中担任几份工作

我知道对于特定的作业ID,我可以使用scontrol hold $ JOBID。如何保留多个ID的作业或/和保留一系列ID的作业(例如scontrol hold 294724-294749)?另外,我该如何...

回答 1 投票 0

Slurmdbd和ssl

我正在尝试使用mariadb数据库作为服务,使用远程mariadb数据库设置slurm,以便在Azure上进行记帐。如果禁用了ssl,则slurmdbd可以正常工作,它可以与...

回答 1 投票 0

Slurm中的默认作业时间限制

我想允许用户计划作业以使用-t,--time = 列出任何作业时间限制。但是,当用户未设置时间限制时,我想强加默认时间限制,因为...

回答 2 投票 1

如何从SLURM中的节点列表向节点的任何[子集]提交作业?

我有数千个作业要在具有16个节点的SLURM集群上运行。这些作业应仅在大小为7的可用节点的子集上运行。某些任务是并行的,因此请使用所有...

回答 3 投票 18

我想在单台计算机上的ubuntu上安装并运行slurm

我想在单台计算机上的ubuntu上安装并运行slurm。我只想运行一些示例示例。这可能吗 ??如果可能的话,我该如何安装和运行它。我已经在Google上搜索过...

回答 1 投票 0

SLURM中的每个节点默认分区

我正在配置一个由SLURM控制的小型集群。该群集具有一个主节点和两个分区。用户提交他们的工作工作者节点,我限制了他们对主节点的访问。每个...

回答 1 投票 0

未经root权限加载R软件包:libproj.so.0:无法打开共享对象文件

我在没有root许可的SLURM服务器中工作,并且我试图加载一些R软件包('sp')进行一些分析。但是,当我加载软件包时,出现以下错误:正在加载...

回答 1 投票 0

sbatch + srun:大量的单线程作业

大家好,我的问题很具体。一个多星期以来,我正尝试使用sbatch和srun提交数千个单线程作业以进行科学实验。问题是...

回答 1 投票 0

是否可以限制用户在SLURM中可以同时使用的cpus数量?

我找到了MaxJobs选项,并与MaxCpus结合使用,这为某人可以使用的cpus数量设置了上限,但同时也激发了他们始终最大化每个作业可以使用的cpus数量。...

回答 1 投票 0

SLURM会根据GRES自动限制内存/ CPU使用率

鉴于单个节点具有多个GPU,是否有一种方法可以根据请求的GPU数量自动限制CPU和内存使用?特别是,如果用户作业脚本请求2 ...

回答 1 投票 2

[slurm超过了python多重处理的作业内存限制

我正在使用slurm来管理一些计算,但是有时作业会因为内存不足错误而被杀死,即使情况并非如此。 python ...

回答 1 投票 1

是否有sbatch错误消息的输出日志/目录?

我正在运行一个摘要脚本,它已成功提交。 sbatch sbatch_script.sh提交的批处理作业309376,但是当我运行squeue -u 并且没有输出是...

回答 1 投票 0

如何查看Slurm作业是否实际上使用指定数量的内核运行

我正在执行一项工作,该工作应该使用具有16个内核的OMP线程。我认为出了点问题,因此我试图在运行时进行监视。我SSH到该节点,并使用top获得以下信息:......>

回答 1 投票 0

暂存空间与主节点磁盘空间中的普通磁盘空间有何不同?

我是HPC的新手,我正在努力设置暂存空间。在正在使用的集群中,我需要使用SLURM工作负载管理器设置Scratch空间。我在与...

回答 1 投票 0

如何立即将所有Snakemake作业提交到Slurm群集

我正在使用snakemake构建可以在SLURM集群上运行的变体调用管道。集群具有登录节点和计算节点。任何真实的计算都应在...

回答 1 投票 2

SLURM批处理是否跨节点自动复制用户脚本?

SLURM(特别是批处理)是否应将用户脚本(而非作业配置脚本)自动复制到集群的计算节点以执行?从我的登录节点执行sbatch文件后,...

回答 1 投票 1

SLURM-按作业名称排序的队列

是否有一种方法可以获取按作业名称排序的刮刀的输出?我知道我可以排序,例如通过squeue --sort = + i通过job-id进行排序,但我看不到如何按作业名排序(由#SBATCH --job-name ...

回答 1 投票 0

Slurm异构工作组正在保留整个分配

我正在Slurm中启动一个异构工作组,其中我的Slurms脚本类似于:#!/ bin / bash srun --pack-group 0 short-process&srun --pack-group 1 long-process&wait And我的...

回答 1 投票 0

如何找到完成的SLURM作业的“命令”(批处理脚本文件名)?

我经常有很多从不同目录运行的SLURM作业。因此,查询作业的工作目录很有用。我可以对队列中的作业(例如,待处理,正在运行等)执行此操作...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.