hpc 相关问题

高性能计算(HPC)是指使用超级计算机和计算机集群来解决各种计算密集型问题。

提取SLURM中以前工作的详细信息

在PBS中,可以使用qstat -f查询特定作 业,并获取(全部?)信息和详细信息以重现该作业:#qstat -f 1234作业ID:1234.login Job_Name = job_name_here Job_Owner = user @ ...

回答 1 投票 0

[使用python提交slurm作业

所以我的foo.sh如下#!/ bin / bash #SBATCH-研究#SBATCH -p long #SBATCH --mem-per-cpu = 1024 #SBATCH -N 1 #SBATCH -n 24 #SBATCH- t 2-00:00:00 #SBATCH --mail-type = END #SBATCH --exclude = node37 ...

回答 1 投票 0

如何在群集上存储TB大小的C ++阵列

我想做一个巨大的仿真,需要大约1 TB的数据来描述一堆相互作用的粒子(每个粒子都有不同的相互作用)。是否可以将此数据存储在C ++数组中?我有...

回答 1 投票 0

即使我们具有单节点多GPU设置,也要限制MPI在单个GPU上运行

我是分布式计算的新手,我正在尝试运行一个使用MPI和ROCm(AMD框架在GPU上运行)的程序。我用来运行程序的命令是mpirun -np 4 ./a.out但这是...

回答 1 投票 1

Snakemake:如何实现将输入/输出文件复制到tmp文件夹并从中复制规则并在其中应用规则的机制

我们使用Slurm工作负载管理器将作业提交到我们的高性能集群。在作业运行期间,我们需要将输入文件从网络文件系统复制到节点的本地文件系统,然后运行...

回答 1 投票 1

如何在OpenMP中实现MPI_MINLOC?

如何使用C语言在OpenMP中计算全局最小值和附加到最小值的索引?我可以用很少的线程获得真正的好处吗?

回答 1 投票 0

用python3查找并移动路径名带有文件的文件>>

我正在尝试从我的perl脚本中重新创建python脚本,以找到所有通用名称为model1_r.pdb的文件,并将它们移动到新文件夹,其名称与先前的现有文件夹相同。这是...

回答 1 投票 -2

dask。分布式SLURM群集Nanny超时

我正在尝试使用dask.distributed.SLURMCluster将批处理作业提交到超级计算集群上的SLURM作业计划程序。所有作业均按预期提交,但在一分钟后...

回答 1 投票 0

如何比较两个列表并提取位置,索引和邻居?

假设我们有两个列表:list1 = [1、2、3、4、5] list2 = [6、7、8、9、10]这是基本结构:列行0 1 2 3 4 0 1 2 3 4 ...

回答 1 投票 0

HPC语-如何使HPC节点同时运行多个作业的bash脚本

假设我有一个HPC集群,其中有一个节点(node_1),我想同时在node_1中发送和运行3个作业的bash脚本。到目前为止,当我将作业发送到node_1时,节点一直处于繁忙状态,直到...

回答 1 投票 0

准备科学程序员/ HPC程序员面试

您能推荐来源/文学作品来为《科学程序员》 /《 HPC程序员访谈》做准备吗?谢谢!

回答 1 投票 0

在群集的节点上启动Jupyter笔记本计算机(高性能计算或HPC设备)

我想在集群的节点上而不是登录节点上运行jupyter notebook。我可以在登录节点上远程运行jupyter笔记本,但这会不必要地减慢群集的使用。 ...

回答 1 投票 1

如何在Linux HPC群集上发现高性能网络接口?

我有一个分布式程序,该程序与在HPC群集上运行的ZeroMQ通信。 ZeroMQ使用TCP套接字,因此默认情况下,在HPC群集上,通信将使用管理网络,因此我有...

回答 1 投票 1

我想在单台计算机上的ubuntu上安装并运行slurm

我想在单台计算机上的ubuntu上安装并运行slurm。我只想运行一些示例示例。这可能吗 ??如果可能的话,我该如何安装和运行它。我已经在Google上搜索过...

回答 1 投票 0

“在Centos 7上安装preCICE之后输出错误命令”>

在Centos 7上的preCICE中运行make test命令后,出现以下错误。有人遇到此问题吗?谢谢...构建cmake3时的cmake参数.. -DBUILD_SHARED_LIBS = ON -...

回答 1 投票 0

IBM Spectrum LSF-访问不同HPC节点上的多个GPU

我正在尝试使用多个GPU:总共8个GPU,每个节点4个GPU设备,总共:2个节点。到目前为止,我遇到了一个``内存不足错误'':我检查了我的tensorflow代码的部分输出,并且只有4 ...

回答 1 投票 0

[pip脱机安装软件包[重复]

我想在未连接到外部世界的群集上安装python3软件包(在这种情况下为torch和torchvision)。我试图做pip3下载 然后...

回答 1 投票 0

python3:离线安装pip软件包

我想在未连接到外部世界的群集上安装python3软件包(在这种情况下为torch和torchvision)。我试图做pip3下载 然后...

回答 1 投票 0

PBS集群节点上的多处理

我必须使用不同的参数(或随机数生成器种子)对同一模型进行多次仿真。以前,我在具有许多核心的服务器上工作,在这里我使用了python multiprocessing ...

回答 1 投票 1

编辑一个已提交的Pbs作业的Job ID号,以使其在队列中的其他作业之前完成提交

亲爱的UNIX / PBS专家:我是UNIX HPC系统(CentOS Linux 7(核心),Linux 3.10.0-693.5.2.el7.x86_64)的用户,我没有任何root特权。在HPC系统上已提交了各种作业...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.