openmp 相关问题

OpenMP是一种跨平台的多线程API,它允许使用特殊的编译器指令进行细粒度的任务并行化和同步。

OpenMP GPU 卸载向量迭代器

我有这个工作测试代码,它映射 std::vector 以进行卸载并检查计算是否正确: #包括 #包括 int main() { int vec_size = 3; ...

回答 1 投票 0

在 While 循环中嵌套 For 循环的 OpenMP 程序偶尔会挂起

我尝试使用 OpenMP 在 while 循环内并行化 for 循环,并遇到程序间歇性挂起的问题,特别是当条件变量接近 1 时。低于...

回答 1 投票 0

Linux 性能和 MKL

我一直在尝试分析我们的应用程序(使用 GCC 5.3 构建并使用 MKL + OMP 的 amd64 RHEL 7.6)。我使用了perf record,但我看到的只是OMP库中的少量样本。 main() 或 ... 中没有任何内容

回答 1 投票 0

Mantevo 的原始 HPCCG 是否执行预处理对称高斯 Seidel 平滑器

Mantevo 的原始 HPCCG 执行预处理对称高斯 Seidel 是否更平滑,因为我似乎在代码库中找不到这一步。它仅在 HPCCG.cpp 中执行共轭梯度

回答 1 投票 0

内存泄漏 - OpenMP

valgrind 告诉我,我的代码中存在以下问题: 泄漏摘要: ==18114==肯定丢失了:0个块中的0个字节 ==18114==间接丢失:0个块中的0个字节 ==18114==可能...

回答 2 投票 0

在 FreeBSD 13.2 中启用 OpenMP 编译 Imagick 是否会导致 sched_yield() 问题?如果是这样,该如何解决?

从我记事起(几年),我们就一直在 Imagick 中使用 OpenMP,但是在我们的系统最近更新到 FreeBSD 13.2 (RELEASE-p9) 后,我们开始遇到随机情况

回答 1 投票 0

openmp 嵌套并行性和 num_threads(1)

所以,在一段不适当的时间之后,我发现,即使您禁用了嵌套 OpenMP,以下示例中的内部并行区域仍然会并行运行: #pragma omp

回答 1 投票 0

CUDA 强制 OpenMP 以单线程模式运行

我写了一个CUDA SGEMM程序,当我想用多线程CPU实现来测试速度时,它无法以多线程方式运行。我单独隔离了 CPU 实现...

回答 1 投票 0

使用 OpenMP 支持编译和链接 CUDA 源文件

是否可以在 CUDA 源文件(而不是内核代码)中使用 OpenMP 编译指示? 我将结合 GPU 和 CPU 计算。但 nvcc 编译器失败,并显示“找不到未知选项‘openmp’&qu...

回答 4 投票 0

在cuda主机代码中使用openMP?

是否可以在 CUDA 文件中使用 openMP 编译指示(而不是在内核代码中)? 我将结合 GPU 和 CPU 计算。但是 nvvc 编译器失败,并显示“找不到未知选项‘openmp’”,如果我是

回答 4 投票 0

使用for循环时的简单openmp c++问题

这是并行计算斐波那契数列的代码。我想知道它在斐波那契数列计算过程中是如何工作的。斐波那契数列的计算需要涉及...

回答 1 投票 0

OMP 在使用 omp Critical 时会导致内存相关的错误,但在使用 omp Ordered 时不会导致内存相关错误

我在 OpenMP 中遇到了一个奇怪的错误。运行程序时,我收到 sigkill 或 sig abort。但有时程序也会成功。 sig Kill 或 sig abort 可能发生在多个地方。一些...

回答 1 投票 0

使用 OpenMP 以 C 语言并行化旅行商问题代码

我有一个 C 代码,可以使用贪心算法解决旅行商问题。然而,当前的实现是顺序的,我想使用 OpenMP 并行化它以实现更好的

回答 1 投票 0

如何将 openMP 安装到 Jenkins 镜像

问题: 我已将 OpenMP 添加到使用 cmake 构建的 C++ 项目中。我使用 ubuntu 18.04 在本地成功构建了它。 然后我尝试在 Jenkins 上构建它,他的......

回答 1 投票 0

omp 库 c++ pragma for

我有这段代码,但我需要帮助来使用 OpenMP #pragmas 来提高其速度。我想并行化变量 i 和 j 上的 for 循环。 n 和 m 的值也可以大得多。为了考试...

回答 1 投票 0

OpenMP 并行化效率极低

我正在尝试用大约 200x200 网格对二维泊松方程进行数值求解。我正在尝试实现对角线方法以实现并行性: #包括 #包括 #

回答 1 投票 0

在C++11中使用OpenMP找到计算值的最大值

我正在寻找 for 循环内计算值的最大值,并在这里存储其相应的索引 max_calc_value 和 i_max ,下面是我的伪代码。我想知道是不是

回答 3 投票 0

通过 cmake 在 /usr/local/lib 中找不到 OMP 库

MacOS 索诺玛 14.2.1、Apple M2 我正在尝试通过 CMake 编译 GMSHFEM。程序使用了OpemMP,这导致了一些问题(因为CMake默认找不到HomeBrew的OpenMP),但最终,我...

回答 1 投票 0

c++并行随机化

使用蒙特卡洛方法计算圆周率。有没有办法使任意数量的线程的随机化都相同?本质上,我正在寻找的是为每个固定组合获得相同的答案......

回答 1 投票 0

Openmp 共享变量子句

如果我在 main 和上面 #pragma omp parallel 中声明一个变量 int n=5 ,那么它是由并行区域内的所有线程共享的,所以我的问题是这个 n 变量存储在哪里以及如何威胁...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.