hpc 相关问题

高性能计算(HPC)是指使用超级计算机和计算机集群来解决各种计算密集型问题。

mpirun 错误:无法访问 PMIx 服务器

当我使用 mpirun 运行 osu_bw 时,出现错误,这是我的日志: $ 哪个 mpirun /数据/软件/安装/oneapi/mpi/最新/bin/mpirun # 我正在使用英特尔 MPI $ mpirun -np 2 ./osu_bw 没有 PMIx 服务器

回答 1 投票 0

Slurm:重命名文件夹中的特定行

我正在尝试使用 for 循环来重复更改文件的行。这是我的代码。 #!/bin/bash # 用于运行多个任务的 SLURM 批处理脚本示例 # SLURM 配置 #SBATCH --节点=1 #SBAT...

回答 1 投票 0

如何在 HPC 中一起运行多个基于 python 的 slurm 作业

我需要提交 100 个 slurm 作业,它们都执行相同的计算,但略有变化(唯一的区别是年份;所有文件都有不同的年份)。有没有办法一起提交

回答 1 投票 0

用于跟踪 HPC 和本地分析文件的 Git 工作流程?

我是 Git 新手,需要有关管理 HPC 集群和本地计算机上文件版本控制的最佳工作流程的建议。 我的例程是在 HPC 上运行脚本 -> 将结果文件带到我的...

回答 1 投票 0

一个节点上运行多个单核

我有一个如下所示的 csh 脚本 foreach n(`seq 1 1000000`) ./myprog${n}.x 结尾 我想并行化它并在我的 slurm 集群上运行它,因为程序的每个实例都需要......

回答 1 投票 0

Slurm 配置问题:运行进程会阻塞整个节点的核心而不是分配的核心

我在分布式计算环境中配置 Slurm 时遇到问题。当我启动一个只应使用 4 个核心的进程时,它最终会阻塞 n 上的所有 128 个可用核心...

回答 1 投票 0

为什么 MPI_Bsend() 是一个阻塞函数?

如以下定义所示,MPI_Bsend() 是一个阻塞 MPI 函数。但这违背了我们对“封锁”一词的普遍理解。所以出现了这些问题:形容词是否“阻塞...

回答 1 投票 0

提交一个调用 srun 的 python 脚本来 slurm

我想用slurm提交一个python脚本,通过bash“sbatch myscript.sh”。在我的 script.sh 中,python 被称为“python running.py” 反过来将使用“check_cal...

回答 1 投票 0

如何控制使用 scikit-learn 的 joblib 启动的进程数量?

背景 当使用 scikit-learn 在大型数据集上执行极其并行的任务时,在高性能计算 (HPC) 环境中的集群上执行此操作会很方便。 Scikit-le...

回答 1 投票 0

对于SLURM集群,为什么我们需要为作业指定内存分配?

计算集群不是可以根据需要动态分配内存吗?

hpc
回答 1 投票 0

如何为这个函数编写cuda内核?

我有一个 C 内核,我想将其转换为 cuda 内核。然而,我在为这个函数编写内核时遇到了麻烦,因为它由多个嵌套循环组成。我的方法是

回答 1 投票 0

Slurm 错误“分配请求的核心/任务必须以季度增量”

嗨,我正在 PSC 中使用bridges2超级计算机来运行作业,当我尝试使用下面的脚本提交作业时,出现错误 sbatch:错误:分配请求的核心/任务...

回答 1 投票 0

使用slurm脚本运行其他snakemake slurm作业

我有一个功能性的snakemake配置文件,用于使用SLURM在HPC上运行作业。如果我在本地运行此脚本,作业将并行提交,并且一切都会按预期进行。 然而,这个管道...

回答 2 投票 0

如何找到 hpcviewer 以便可视化 hpcrun 生成的跟踪数据?

我的问题是关于 hpcviewer,它是一个可视化生成的跟踪数据的工具 由 hpcrun 提供。 我成功安装了 hpctoolkit,但查找 hpcviewer 时遇到问题。 为了测试该工具包,我创建了一个

hpc
回答 1 投票 0

Seurat FindClusters() 似乎在一次迭代后冻结了

我尝试在 RedHat Linux HPC 上使用以下命令在大约 20G、300K 单元的数据集上运行 FindClusters(): df <- FindClusters(df, resolution=seq(0.01,1,by=0.1), verbose = TRUE,

回答 1 投票 0

在虚拟环境中通过 SSH HPC clutser 安装 pip 包时出现 TLS/SSL 认证错误

我正在尝试在 HPC 集群上的虚拟 venv 中安装 python 包。 (metaTS_venv) [xxxuser@hpc metaTS]$ pip3 安装 pandas 我收到下面的 TLS/SSL 错误。如果我安装在我的电脑上,它就可以正常工作...

回答 1 投票 0

SLURM 报告内存消耗

我试图了解一个简单的作业消耗多少内存(基于这个python脚本)。我在分配了不同数量的核心的单个工作线程上运行相同的脚本。 结果

回答 1 投票 0

为工作站和 HPC 设置令人尴尬的并行代码的最佳方法

我正在寻找最通用/最简单的方法来运行具有变化的输入的令人尴尬的并行代码。 我希望最终的解决方案能够在工作站上运行(没有可用的 PBS),但是...

回答 1 投票 0

可以在服务器中从anaconda创建conda环境吗?

我正在尝试将特定的软件安装到我的大学 HPC3 服务器上。安装教程上说需要安装 conda 环境。然而我被拒绝了

回答 1 投票 0

在并行处理中更改$TMPDIR

我在高性能计算系统上运行批处理作业来对对齐的读取进行排序,并使用 GNU 并行来加速我的工作,但我的工作失败了,原因如下: 并行:错误:输出为

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.