使用sco指定跨节点的worker的分布

问题描述 投票:2回答:1

在HPC群集上运行scoop程序时,有没有办法指定跨节点的工作人员分布?

我最近才遇到过scoop,到目前为止它似乎是一个很好的工具,用于快速转换设计为在单个计算节点上使用多处理运行的代码,以及同时利用多个节点的代码。

但是有没有办法使用sco在集群中每个计算节点只运行一个worker,以便允许代码中更深层次的多线程在每个多核节点内运行?

我知道可以指定使用-n标志初始化的worker数,或使用主机文件或--hosts标志指定要连接的特定主机(http://scoop.readthedocs.io/en/latest/usage.html#how-to-launch-scoop-programs)有没有办法使用主机文件这个?如果是这样,如何在具有调度系统(例如在这种情况下为扭矩)的集群上完成,这通常会将节点分配给程序?

如果用scoop无法做到这一点,可以用其他软件包(MPI,Parallel Python,pathos等)来完成吗?

python parallel-processing hpc
1个回答
0
投票

刚开始用自己的独家新闻。

似乎您可以通过主机文件指定每个主机的工作器数量来完成此操作。

主机文件具有以下语法:

hostname_or_ip 4
other_hostname
third_hostname 2

其中名称是系统主机名或IP地址,数字表示要启动的工作人员数。

见:https://scoop.readthedocs.io/en/0.7/usage.html#hostfile-format

© www.soinside.com 2019 - 2024. All rights reserved.