OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。
我有一个2D游戏,除了UI之外,只需要绘制纯色圆圈。该游戏还已经使用 OpenCL 来计算圆圈的物理特性(有点像粒子模拟)。
c++ opencl 返回 CL_OUT_OF_RESOURCES
我正在学习OpenCL并尝试在图片上应用黑白,但enqueueNDRangeKernel返回CL_OUT_OF_RESOURCES,我不明白为什么。 OpenCL 在 GTX 980M 和 OpenCL 1 上运行......
我有这个 OpenCL 内核用于计算 Buddhabrot-Set: // ... 初始化事物 而(真) { Z2=Z*Z; Z = (float2)(Z2.x - Z2.y + Point.x, 2 * Z.x * Z.y + Point.y);...
显示队列、提交、开始、结束的时间函数如下: void PrintProfilingInfo(cl_event 事件) { cl_int err_num = -1; cl_ulong t_queued; cl_ulong t_已提交;...
OpenCL 内核执行时间较长,我将其拆分以避免超时,但它们仍然发生
我有这个 OpenCL 内核,根据参数的不同,它可能需要很长时间才能执行。然后我收到某种超时错误(没有消息,但屏幕闪烁并且崩溃)。我试过了...
为什么 float 的 OpenCLatomic_add 实现会产生不确定的结果?
我需要从 OpenCL 中的多个线程中向同一全局内存地址添加一个浮点数。对于任何两次模拟运行,结果永远不会相同,并且对atomic_add_f函数的调用......
我正在尝试让两个 OpenCL 内核相互通信。 A 工作内核运行一个循环,控制内核向其提供作业并告诉 当它完成时。我正在使用易失性设备缓冲区
我正在尝试查看 Opencl 编程模型在 GPU 上的性能,现在在测试编程模型时,我必须使用 clEnqueueNDkernel() 来启动内核,我尝试调用它
我在 OpenCL 1.2 中遇到问题。 看,我在内核中有一个 __global 数组,组大小为 1000。 问题是atomic_add() 函数无法正常工作。 我的内核代码是:
我一直在阅读CUDA和OpenCL的编程指南,但我不明白什么是银行冲突。他们只是深入研究如何解决问题,而不详细说明主题
我编写了一个小型 OpenCL 应用程序,用于计算两个矩阵的乘积。现在我注意到,如果矩阵的大小超过 8192 x 8192,则会出现显着的性能下降(计算...
被这个问题折磨了很长时间,请问你的建议是往哪个方向移动。目标 - 在 Windows 上使用 yolo 开发通用应用程序,可以使用 AMD/Nvidia/Int...的计算能力
OpenCL:for 循环中的 CL_OUT_OF_RESOURCES
我正在尝试执行 OpenCL,但它给了我一个 CL_OUT_OF_RESOURCES。情况如下: 我正在测试 100 个工作项,因此我将 global_sizes 和 local_sizes 设置为 100。 我创建了一份令状...
通过 OpenCL 加速 intel CORE i7 处理器
假设我有一台没有任何监视器的服务器计算机,并且有一个算法在其上运行(进程)。我可以通过使用 OpenCL 来提高算法的性能吗
我正在内核中运行排序算法,排序部分使用了大约36 VGPR,从而导致12.5%的占用率和糟糕的性能。 代码段如下: 类型定义结构{ 佛罗里达...
是否可以使用 AMD 显卡在 ArrayFire 和 OpenGL 之间来回切换? 有一篇文章介绍了如何使用 CUDA 来做到这一点。关于对 OpenCL 使用类似方法的任何提示,因此可以使用...
AMD OpenCL 致命错误:CL/cl.hpp:没有这样的文件或目录
我正在尝试在 Visual Studio 2015 中使用 C++ 中的 OpenCL 在 Windows 7 上编译一个简单的“hello world”程序。尝试构建时,我收到此错误: 无法打开包含文件:'CL/cl.hpp':...
AMD Tahiti 上的 OpenCL / OpenGL 隐式同步
我在 AMD Tahiti(AMD Radeon HD 7900 系列)设备上遇到 OpenCL 和 OpenGL 的“隐式同步”问题。该设备具有 cl/gl 扩展、cl_khr_gl_sharing、...
将 async_work_group_copy() 与指针一起使用?
__kernel void kmp(__global char pattern[1*4], __global char* string, __global int 失败[1*4], __global int ret[1], int g_length、int l_length、int thread_num...