我正在尝试运行 Intel 版本的 HPL 基准测试这里,我对这些选项有点困惑。
我(目前)想做的是单节点运行。该节点具有 2 个 Xeon Platinum 8276 处理器,因此共有 56 个内核。所以我的 PxQ 应该是 56。
但是英特尔文档说:
mpirun -np
mpirun -perhost
对我来说,这些似乎不一致?使用 OMP_NUM_THREADS 是如何适应这种情况的?
如果您只是执行单个节点运行,则有一个不同的二进制文件 - 您不会使用 MPI。对于 Intel 的 MKL,您可以在 here
下载该库英特尔拥有针对各种处理器进行优化的预构建二进制文件。以 Xeon 为例,它是:
cd /home/grant/Downloads/benchmarks_2024.0/linux/share/mkl/benchmarks/linpack
./runme_xeon64