opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

是否可以将异步回调/继续附加到SYCL内核?

我有数千个SYCL内核要执行。这些内核中的每一个完成后,我需要在由所述内核写入的cl :: sycl :: buffer上执行一个函数。我正在使用的方法...

回答 1 投票 1


根据OpenCL中的设备内存确定最大全局工作组大小?

我能够根据设备内存列出以下有助于限制设备工作项的参数:CL_DEVICE_GLOBAL_MEM_SIZE CL_DEVICE_LOCAL_MEM_SIZE ...

回答 1 投票 6

在OpenCL库中找不到cl :: Error类

我在一些代码中看到OpenCL库中有一个名为cl :: Error的类,通过它可以捕获OpenCL代码中的错误和错误类型。但是当我在代码中添加内容时,就像这样#include

回答 1 投票 0

OpenCL内核批量实现im2col

我正在尝试将为CPU编写的安全功能调整为适用于GPU的OpenCL内核。该功能是许多深度学习应用程序中使用的众所周知的im2col。我在...

回答 1 投票 0

从OpenCL中的GPU编程中获取初始值

我开发了一个小代码,通过OpenCL库使用GPU添加两个小向量。主要代码vectorAdd.cc如下:#include #include #include #... ] >>

回答 2 投票 0

AVX2和AVX-512有什么区别?

就SIMD和并行化而言,AVX2和AVX-512有什么区别?他们是同一件事还是不同?我只是看到double8用于AVX-512,而double4用于AVX2?我...

回答 1 投票 0

使用OpenCL优化而不是多处理池映射

在我的代码的第一个版本中,我使用了python的Multiprocessing库,该库应用于16个线程的主函数MAIN_LOOP上,如下所示:def MAIN_LOOP(lll,seed = None):global aa global ...

回答 1 投票 -1

OpenCl中的多线程

我已经开始研究OpenCl,并且对工作组和内核的工作原理有一些基本的了解。假设我的向量大小为1024,GPU的WorkGroupSize为256。所以我的WorkGroupSize ...

回答 1 投票 0

如何从数组中获得一个求和数组

我是openCL的新手。我知道如何求和一维数组。但是我的问题是如何从openCL中的1个1D数组中获取一个sum数组。 int a [1000]; int b [1000]; .... //将数据保存到for(...

回答 2 投票 3

用于压缩缓冲区的快速算法

我正在执行图像压缩。图像I被分解为K个代码块{Bi}。每个块具有固定大小的MxN像素。每个块被独立压缩。所有压缩块{Ci},...

回答 4 投票 1

为什么float4会以前缀和执行浮点运算

[在OpenCL中,马修·斯卡皮诺(Matthew Scarpino)评论说,将其前缀和从32位浮点数转换为4位浮点数的128位集合会带来显着的性能提高,几乎提高了4倍...

回答 1 投票 0

OpenCL的内核结果不一致

[当我尝试这样做时,即使将'cum'数组的值复制到输出,我在'output'上也会得到错误的结果。但是,如果重命名代码前面提到的'cum'数组。我得到正确的值...

回答 1 投票 0

OpennCL中是否有分散原语?

我正在按以下说明实施拆分操作:https://developer.nvidia.com/gpugems/GPUGems3/gpugems3_ch39.html。目前,我正在尝试实施分散步骤。分散只是执行一个...

回答 1 投票 0

如何使以下顺序代码并行?

我想使以下内核代码并行,在下面的代码中,a的大小为n,b和c为8 * n,而d的大小小于n(例如:3 * n / 4)j = 0; for(i = 0; i ] >>>

回答 1 投票 -2

OpenCL内核是否异步执行?

对于CUDA,我知道在将启动命令发布到默认流(空流)后,它们是异步执行的,那么在OpenCL中呢?示例代码如下:cl_context上下文; ...

回答 2 投票 2

在Radeon卡上并行执行几个OpenCL内核

在Nvivdia卡上,我曾经创建许多队列,然后将内核排入每个队列,这使得内核可以并行执行。它曾经确实加速了我的程序。但是现在我使用Radeon卡...

回答 1 投票 0

定义$ OPEN_CL_LIB时遇到问题。我该怎么办?

我在定义$ OPEN_CL_LIB时遇到问题。我通过sudo apt install ocl-icd-opencl-dev成功安装了此应用程序。完成此步骤后,我遇到了同样的问题。 “请将$ OPEN_CL_LIB设置为...

回答 1 投票 0

clFFT编译问题:对`clGetPlatformInfo'和其他OpenCL函数的未定义引用

我尝试构建clFFT库(用于使用OpenCL进行FFT)和包含在clFFT git中的示例。 1)首先,进入/ opt /,我做了:git clone https://github.com/clMathLibraries/clFFT.git 2)之后,总是...

回答 1 投票 1

设置内核参数时为CL_INVALID_ARG_SIZE

我正在尝试脱离CUDA并学习OpenCL。我认为n身体模拟可能是一个不错的起点。我一直在使用c ++包装器,并按照此处提供的教程进行操作...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.