slurm 相关问题

SLURM是一个开源资源管理器,专为各种规模的Linux集群而设计。

Slurm 作业导致执行时间异常

我有这样的工作脚本, #!/bin/庆典 #SBATCH -p cs #SBATCH -e %j.err #SBATCH --时间=40:00 #SBATCH --output=slurm-%j.out #SBATCH --cpus-per-task=2 #SBATCH --nodes=1 #SBATCH --ntasks=1 # 执行...

回答 2 投票 0

语法错误:预期操作数(错误标记为“* 2”)

我正在运行一个脚本并得到这个输出: /var/spool/slurm/slurmd/job390083/slurm_script:第 3 行:* 2:语法错误:预期操作数(错误标记为“* 2”) 100_S46 错误:无法...

回答 0 投票 0

如何回到父目录?

我想在运行以下脚本时将我的目录更改为脚本的父目录: #!/bin/庆典 #SBATCH --job-name=INCAR #JobName . . . . . . . 。(跳过) 模块加载 intel/2020a 模块 l...

回答 0 投票 0

迭代循环的 slurm 作业脚本

我使用这样的 bash 脚本, 因为我在 0 1 2 3 4 5 做 导出 OMP_NUM_THREADS=$((2 **i)) && ./debug > ./logs/112500/exp$1/log-$((2 **i)).txt 完毕 现在我需要运行这个脚本......

回答 1 投票 0

rsync无法通过slurm连接到主机

我目前正在使用 Slurm 来安排使用 Rsync 的数据传输。我通常使用 SSH 和命令“ssh user_name@server”连接到目标服务器,它在没有 ...

回答 1 投票 0

Slurm 待处理工作

我对 slurm 有疑问,我执行的每项工作都处于待处理状态 我不知道该怎么做(我是这个领域的新手) 控制:显示工作 JobId=484 JobName=Theileiria_project UserId=dhamer(1037) GroupId...

回答 2 投票 0

在 SLURM 下运行时 Python 多处理性能低下

我正在运行一个 Python 代码,该代码对并行任务采用多处理。当我在我的本地机器上运行它时,一切都按预期工作,但是当我使用一个 2x AMD 集群,每个 n 有 64 个内核时......

回答 0 投票 0

slurm:优先考虑任务较少的工作

我是 Slurm 的新手,我查看了关于它的 QoS 文档,但我需要从有经验的 Slurm 用户那里获得建议。 为了解释这个标题,让我们考虑一下有人排着长长的队,但是...

回答 0 投票 0

R

cur_dir<-"C:/Users/child/Dropbox/Proteogenomics_analysis/Proteome and Phosphoproteome Data Normalization/Experiment_data_20230222_Metabric_multistate_analysis" setwd(cur_dir) library(

回答 0 投票 0

Slurm:计算节点只在本地保存输出

这是我第一次安装 slurm 而不是使用它,我有两点还不清楚: 在尝试了很多方法后,我终于得到了 slurm(一个控制器和一个计算节点)......

回答 1 投票 0

使用 slurm 用户运行 Ansible:How to fix ansible.legacy.setup failed to execute?

任务 [收集事实] ********************************************* ****************** 任务路径:/opt/playbook/site.yml:1 使用模块文件 /usr/local/lib/python3.10/dist-packages/ansible/modules/setup.py

回答 1 投票 0

gprof 的输出 gmon.out 在完成之前取消 slurm 作业时没有出现

我正在使用 gprof 分析 Fortran 代码。 我在一个集群上运行这段代码,我从 1 个节点请求 24 个核心。 作业是通过 slurm 提交的。 运行代码的命令,在 submission.sh 我...

回答 0 投票 0

如何让 Pytorch Lightning 在多个 GPU 上运行?

我在 Pytorch Lightning 中有一个模型,我想在多个 GPU 上训练以加快进程,并且一直在关注 https://pytorch-lightning.readthedocs.io/en/stable/accelerators/gpu_interm...

回答 0 投票 0

提交使用存储库文件的 slurm 作业然后在等待它完成时切换 git 分支是否有解决方法?

我经常提交可能会排队一段时间的 slurm 作业。 slurm 脚本将引用我工作目录中的代码,例如 python 训练脚本。 在等待的时候,我会...

回答 1 投票 0

如何编写一个 shell 脚本来排队并提交给定的计算(在 fortran 中)指向节点?

我有一个 Fortran 代码(运行良好),我需要提交队列并将其定向到节点。 我手动编译了 fortran 代码。 .bash 代码给出以下错误: n19 1个 ...

回答 1 投票 0

显示用户可以在 SLURM 中访问的所有分区

我正在将脚本从 SGE 转换为 SLURM。 在 SGE 中,脚本会生成用户 $USER 可以访问的队列列表 - $ qstat -U $USER -g c 集群队列 CQLOAD 使用 RES

回答 1 投票 0

在多个节点上运行 python 脚本的 Slurm 参数

我正在尝试在集群上并行运行 python 脚本,但我发现 slurm 非常混乱。 我可以访问不允许我在单个节点上运行脚本的 HPC 集群,我必须重新...

回答 0 投票 0

使用 slurm 中的 srun 根据最大作业数运行串行作业

美好的一天, 有没有办法设置 slurm,当作业数量超过用户拥有的最大作业数量时,其余的将自动连续执行? 例如;我最多有 50

回答 0 投票 0

Segmentation fault (11) Error while running a CFD solver in Linux cluster

我正在为许多设计点运行 CFD 求解器(CFD++ by metacomp technologies)。每个设计点都有一个单独的文件夹,其中包含所有需要的文件并用于在 Linux 中提交一个模拟

回答 0 投票 0

SLURM 作业数组 $SLURM_ARRAY_TASK_ID 不工作

我正在尝试使用我将 $SLURM_ARRAY_TASK_ID 传递给 Python 的 argparse 的作业数组提交多个作业,但 $SLURM_ARRAY_TASK_ID 不会打印或生成预期的作业文件。 这是...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.