opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

如何让 CUDA 流等待尚未安排的工作? (即类似用户事件的模式)

我想在 CUDA 流上做一些工作,比如内核 K,这取决于之前需要在 CPU 上完成的工作。 CPU工作的具体细节我并不知道...

回答 3 投票 0

CL_OUT_OF_HOST_MEMORY clBuildProgram

我有这段代码(Java / LWJGL)来创建我的 OpenCL 程序。 尝试 { CL.create(); } catch (LWJGLException e1) { e1.printStackTrace(); } 平台 = CLPlatform.getPlatforms().get(0); 设备 =

回答 1 投票 0

需要将图像坐标镜像到边界之外的功能

我正在对维度图像执行 NxN 图像卷积 w 和 h,其中 N 远小于 w 或 h。给定一个坐标 alpha,我想计算一个新的坐标 safe_alpha ......

回答 2 投票 0

OpenCL 1.2 读取/写入图像数据

我正在使用标志 CL_MEM_READ_WRITE 在主机上创建一个 Image2d 对象。该图像是一个内核的输出,我希望将其用作另一个内核的输入。我也在用

回答 2 投票 0

OpenCL 16 位浮点数

如何将 16 位浮点数(cl half)传递到 .cl 文件中的 OpenCL 内核? 我的 .cl 文件中有: __kernel void func(__global half* a, __global half* b, __global half* res){ int i = get_global_id(0)...

回答 1 投票 0

Cytoscape 如何选择特定的GPU卡?英伟达优于英特尔

我的电脑有两张卡:一张 Intel 和一张 NVIDIA。尽管我在 Cytoscape Desktop OpenCl 首选项中选择了 NVIDIA 卡,但一切都在 Intel 卡上运行。 我怎样才能强制它使用 NVIDIA o...

回答 1 投票 0

内核调用的 OpenCL 开销

我想测量 OpenCL 内核在循环中的执行时间。当我使用 clGetEventProfilingInfo() 测量入队、提交和启动内核的时间时,我遇到了一大堆...

回答 1 投票 0

Windows 中使用 Radeon Pro VII 的 GPGPU

我从问题开始,以防有人可以在不浏览整篇文章的情况下说些什么: 在 Windows 中开始使用 C++ 进行 Radeon Pro VII 编程的最简单方法是什么? 对于任何...

回答 1 投票 0

OpenCL 在尝试读取内核输出时永远挂起

这是 OpenCL 主机在微不足道的内核结果中耗尽内存的后续结果,在应用更正并出现另一个错误后,我发现我的程序在 EnqueueReadBuffer 中挂起......

回答 1 投票 0

使用 CUDA 计算数百个小矩阵的特征值/特征向量

我有一个关于使用 CUDA 对数百个小矩阵进行特征分解的问题。 我需要计算数百个(例如 500 个)小(64×64)实对称的特征值和特征向量

回答 2 投票 0

有关为 Android 设备构建 CLBlast 和 OpenCL 的一些问题

我在做什么 我正在使用 JNI 编写 Android 应用程序,并且想使用 CLBlast 加速 C++ 代码。 背景 我已阅读 https://github.com/CNugteren/CLBlast 中的 Android 指南,并且知道我必须这样做

回答 1 投票 0

计算单元、SMX、CUDA 核心等之间有什么关系?

我对这些术语很困惑...我知道 nVidia GPU 有一些流式多处理器 (SMX),每个处理器由多个 CUDA 核心(流式处理器,SP)组成。然而...

回答 1 投票 0

OpenCL 主机在琐碎的内核中内存不足

我正在尝试在一个示例学习程序中使用内核,该程序具有 1024 个输入缓冲区条目和输出缓冲区两个 32 位浮点条目数组。 https://anteru.net/blog/2012/gett...

回答 1 投票 0

GPU 编程、CUDA 或 OpenCL 还是? [已关闭]

GPU 编程的最佳方法是什么? 我知道: CUDA 非常好,有很多开发人员支持和非常好的 zo 调试,但仅限于 NVidia 硬件 OpenCL 非常灵活,可以在 NVidia、AMD 和

回答 1 投票 0

opencl命令队列是如何工作的,我能要求它做什么

我正在研究一种算法,它可以多次执行几乎相同的操作。由于该操作由一些线性代数(BLAS)组成,我想我会尝试使用 GPU 来完成此操作。 我已经...

回答 2 投票 0

OpenCL 检测错误

我是 Adobe Premiere 和 GPU 加速的新手。我开始遵循使用 Premiere Pro CC 编辑视频的简单教程,当我将鼠标悬停在视频上时,几秒钟后出现“停止工作”错误...

回答 2 投票 0

Opencl 工作项和流处理器

工作项和流处理器(cuda core)之间有什么关系?我在某处读到,工作项的数量应该大大超过核心的数量,否则,就没有性能......

回答 2 投票 0

这个 GPU 计算或着色器模式叫什么(如果有的话)?

首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...

回答 1 投票 0

在 OpenCL 中将整数转换为浮点数

这是我关于堆栈溢出的第一篇文章,所以请耐心等待。 我目前正在编写 OpenCL 内核并需要使用内置 sqrt 函数。然而,要使其发挥作用,

回答 1 投票 0

JOCL CL_OUT_OF_RESOURCES 仅当已分配值时

我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.