openmp 相关问题

OpenMP是一种跨平台的多线程API,它允许使用特殊的编译器指令进行细粒度的任务并行化和同步。

等一下

我正在研究一些看起来相当简单的 openmp 代码。 我无法复制代码,但它看起来像 #pragma omp 并行 { #pragma omp for nowait 对于 (size_t i = 0U; i < container.siz...

回答 0 投票 0

如何在 android 原生代码中并行运行 OpenMP?

我目前正在使用 OpenMP 的#pragma 将 Android 应用程序的本地循环代码分发到并行线程,如下所示: #pragma omp parallel shared(variable1) shared(variable2) shared(variable3) p...

回答 2 投票 0

随着 N 的增加,OpenMP 独家扫描减少段错误

我在执行独占扫描时有以下代码。这段代码一直运行到 N 变得足够大为止。在我的机器上,它在 N=10000000 时开始出现段错误。这里的问题到底是什么? #

回答 0 投票 0

Visual Studio 2015 r 工具中的 Rcpp 编译器错误

我是 Rcpp 和 OpenMP 的新用户。 我已经编写了将两个数组相乘的代码。 我也想使用 omp 来检查它在大矩阵上的性能。 我在 Visual Studio 2015 中使用 R 工具来工作...

回答 1 投票 0

使用 -fopenmp 编译解决了编译问题,但导致 gsl_vector_double.h:180: ERROR: index out of range when call apop_estimate

我无法使用 apop_estimate(data, model) 函数运行任何程序。 如果我在编译命令中不包含 -fopenmp 选项,我会收到错误消息: $ gcc census.c -std=gnu99 -lapophenia...

回答 0 投票 0

提高稀疏矩阵矩阵乘法算法性能的方法有哪些?

我在优化对两个稀疏矩阵执行矩阵矩阵乘法的代码时遇到问题。矩阵使用 3 个子数组存储,存储行索引、列索引和变量...

回答 0 投票 0

使用“omp if”和“reduction”时潜在的 gfortran 或 openMP 错误

我有一个 MWE,如果我添加 GPU 卸载选项(即使未使用),omp 减少会中断。 我知道我可以使用预处理器指令来解决问题,但我真的更愿意...

回答 1 投票 0

使用 OpenMP 的特征矩阵操作加速

我是 OpenMP 的新手,试图加速以下 for 循环,但我无法获得比顺序计算更快的并行版本。 代码片段如下: typedef 本征::矩阵<

回答 0 投票 0

在带有 OpenMP 和 Eigen 的嵌套 for 循环中使用 Reduction

我正在尝试并行化以下具有 while 循环和嵌套 for 循环的函数(迭代求解器)。代码如下: 静态常数 int nx = 128; 静态常量 ny = 128;

回答 1 投票 0

可以在这些 fortran 循环上使用 OpenMP 吗?

这是我的问题:我有一个带有一定数量嵌套循环的 Fortran 代码,我想知道是否可以使用 OpenMP 来并行化它们? 这是 Fortran 代码: 我 = 0 做...

回答 1 投票 0

openMP Mac M1 芯片

有人能让在mac M1上工作吗?我已经花了好几天尝试使用 Xcode 让它工作。 这就是我所做的: 安装 Brew:https://brew.sh/ 然后注意到 PATH 不是

回答 0 投票 0

如何使用 OpenMP 使用 SAVE 和 ENTRY 语句重写代码?

我正在为 OpenMP 使用重写一个大型 Fortran-77 程序,其中一个文件包含一个子程序,其中标记为 SAVE 的重要变量在主程序第一次运行时被初始化 ...

回答 0 投票 0

需要帮助将 C++ 程序与 OpenMP 并行化

我有这段代码,我正在尝试与 OpenMP 并行化。它使用加载有点(X、Y 和 Z 坐标)的向量向量,然后旋转和移动点并找到

回答 2 投票 0

OpenMp 根据变量设置并行循环的线程数

有没有一种方法可以根据变量的值在 OpenMP 并行区域中设置线程数?最初对于整个应用程序的线程数 = nofCores。在我的 AMD FX 8350 上,nofCores...

回答 1 投票 0

为什么 macOS M2 上的 cmake 找不到 OpenMP?

我已经设法在我的 macbook 上编译 OpenMP,但它不会在多线程上运行应用程序。我在这里使用了答案。 这是我的 CMakeList.txt: cmake_minimum_required(版本 3.12) 项目(

回答 1 投票 0

带有 C++ 的 OpenMP:模板函数中并行化 Lambda 的内部编译器错误

我有调用模板函数的代码,该函数定义了一个 lambda,然后调用它。尝试使用 OpenMP 中的自定义缩减来并行化 lambda 时,出现内部编译器错误。我是...

回答 1 投票 0

python 中的 MPI 并行化以并行化“for 循环”给出空值

我想在 python 中使用 OpenMP 或 MPI gather 并行化“for 循环”迭代。代码如下所示。我还参考了 python (MPI) 中的 MPI 手册,并从 co... 开始......

回答 0 投票 0

如何在 python 中使用 MPI 来并行化“for 循环”

我想在 python 中使用 OpenMP 或 MPI 分散聚集来并行化“for 循环”迭代。代码如下所示。我还参考了 python (MPI) 中的 MPI 手册并开始使用...

回答 0 投票 0

omp Fortran 循环与数组操作的效率比较

我正在比较 Fortran 中 openmp 与不同组织在循环索引上的效率以及是否拆分索引 对于给定的代码 程序测试 使用,Intrinsic :: iso_fortran_env,Onl ...

回答 0 投票 0

How to efficient parallel matrix multiplication for small external indices and large internal indices in Fortran

我有一个矩阵乘法,A[a,b]*B[b,c]=C[a,c]。 a、c的外部尺寸小,b的内部尺寸大。在这种情况下如何高效并行? (如果 a 和 c 很大,那就是

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.