openmp 相关问题

OpenMP是一种跨平台的多线程API,它允许使用特殊的编译器指令进行细粒度的任务并行化和同步。

OpenMP 并行化效率极低

我正在尝试用大约 200x200 网格对二维泊松方程进行数值求解。我正在尝试实现对角线方法以实现并行性: #包括 #包括 #

回答 1 投票 0

在C++11中使用OpenMP找到计算值的最大值

我正在寻找 for 循环内计算值的最大值,并在这里存储其相应的索引 max_calc_value 和 i_max ,下面是我的伪代码。我想知道是不是

回答 3 投票 0

通过 cmake 在 /usr/local/lib 中找不到 OMP 库

MacOS 索诺玛 14.2.1、Apple M2 我正在尝试通过 CMake 编译 GMSHFEM。程序使用了OpemMP,这导致了一些问题(因为CMake默认找不到HomeBrew的OpenMP),但最终,我...

回答 1 投票 0

c++并行随机化

使用蒙特卡洛方法计算圆周率。有没有办法使任意数量的线程的随机化都相同?本质上,我正在寻找的是为每个固定组合获得相同的答案......

回答 1 投票 0

Openmp 共享变量子句

如果我在 main 和上面 #pragma omp parallel 中声明一个变量 int n=5 ,那么它是由并行区域内的所有线程共享的,所以我的问题是这个 n 变量存储在哪里以及如何威胁...

回答 1 投票 0

核心隔离将 OpenMP 限制为单个核心

在调查代码的性能问题后,我意识到在隔离核心上运行的基于 OpenMP 的并行代码会限制单个核心的线程数量。 这段代码应该展开......

回答 1 投票 0

为什么 privatethread() 中的一个线程与 OpenMP 中的全局变量共享相同的内存地址?

假设我们有一个变量var=100。 private(var) 子句创建 n 个附加变量,为 n 个线程中的每一个分配一个变量: 在并行之前,var 的值和地址是 100, 0x7ffd683992...

回答 1 投票 0

基于 OpenMP 的循环,缩减规模很差

我有一个循环,我正在尝试与 OpenMP 有效地并行化。它涉及累积矢量流的 L2 范数,并进行缩减。这是循环: 结构体vec3 { 弗洛...

回答 1 投票 0

使用 openMP 在指定核心上执行特定功能

是否可以使用 OpenMP 修复一个函数以在特定内核上运行? 例如:我有两个函数,即:Foo1 和 Foo2 我的计算机(Linux 操作系统)有两个核心:core0 和 core1。 所以,H...

回答 2 投票 0

如何让OpenMP线程或任务运行在某个核心上

有没有办法让OMP线程或任务在某个核心上运行? 我找到了这个,点击了链接,但我找不到源代码来测试它。这也是英特尔的解决方案(我认为)。 ...

回答 1 投票 0

如何修复“OMP:错误#15:正在初始化 libiomp5.dylib,但发现 libiomp.dylib 已初始化”错误?

在控制台中运行 Python 3.6 Jupyter 笔记本时出现此错误。 OMP:错误#15:正在初始化libiomp5.dylib,但发现libomp.dylib已经初始化。 OMP:提示这意味着

回答 3 投票 0

矩阵乘法优化 (OpenMP) - C

我正在学习一些有关 openMP 的知识,并尝试在这里使用它来将两个矩阵相乘。 无效matrix_multiply(矩阵*A,矩阵*B,矩阵*C){ #pragma omp 并行 { #

回答 2 投票 0

尽管使用了互斥体,C++ 并行程序中仍存在持续数据争用警告

尽管使用互斥体,我在 C++ 并行程序中遇到了持续的数据争用警告。我已经使用 OpenMP 和互斥体实现了一个解决方案来同步对共享数据的访问,但我认为...

回答 1 投票 0

std::sort 比自定义 OpenMP 并行排序算法快得多

我一直在使用 OpenMP 测试并行排序。我实现了奇偶排序算法,该算法比没有 OpenMP 时快 3 倍。然而,std::sort 仍然更快:seq - 100s,parallel - ...

回答 1 投票 0

有关 Hi-CLASS 库和 Python3.9 的问题(均由 macOS Intel API 构建):脚本上的段错误

独特的 python3.9 解释器对 2 个代码有问题: 第一个工作正常,第二个则不行。 我已经在 MacOS 14.0 上安装了所有 Intel oneapi 框架。 然后,我就编译好了...

回答 1 投票 0

基于 OpenMP 的 Pytorch 与 CUDA 扩展

我尝试使用libtorch和OpenMP开发pytorch扩展。 当我测试我的代码时,它在 CPU 模型中运行良好,大约需要 1 秒才能完成所有操作: s = 时间.time() adj_矩阵 =

回答 1 投票 0

使用 openmp 并行化 N 体模拟

我正在尝试并行化 Fortran 代码以进行 N 体模拟,但与顺序版本相比,它总是需要更长的执行时间,并且执行时间随着 nu 的增加而增加...

回答 1 投票 0

在 Mac OSX 上通过动态链接使用 OpenMP 编译 C++

总结 如何在 Mac OSX 上以可移植的方式使用 OpenMP 编译 C++ 代码? 有许多来源建议在 OSX 上使用 OpenMP 编译 C++ 的解决方案,例如: OSX 10.11 上的 OpenMP 支持...

回答 2 投票 0

OpenMP 在二维数组中使用 ++ 增量

我有两个大型一维输入数组(input_array1 和 input_array1),其中包含数十亿个值范围从 0 到 100 的元素,以及一个输出二维数组(array_101x101),其中包含 101...

回答 1 投票 0

具有公共块的 Fortran 子例程的 OpenMP 并行化问题

我发现自己在尝试并行化用于有限元分析的旧 Fortran 程序时面临着一个复杂的问题。该程序非常广泛,有超过一千个子例程,使用了 co...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.