gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写,被称为“图形处理单元(GPU)上的通用计算”

大型数组的前缀扫描

我想使用GPUgem中的指令编写一个大型数组的前缀扫描,这是我的并行类的作业。我确实遵循了书中的所有步骤,但我的代码仍然无法工作。我得到了...

回答 1 投票 0

计算着色器除了工作组之外还有局部大小还有什么意义?

有什么区别 无效 glDispatchCompute(1, 1, 1); 布局(local_size_x = 100,local_size_y = 100,local_size_z = 1)中; 和 无效 glDispatchCompute(100, 100, 1); 布局(local_si...

回答 1 投票 0

使用多个 GPU OpenCL

我有一个循环,在其中将多个内核启动到 GPU 上。下面是片段: for (int idx = 开始; idx <= end ;idx ++) { ret = clEnqueueNDRangeKernel(command_queue,

回答 2 投票 0

OpenCL 如何在从主机读取结果之前等待设备端队列完成

这是我简化的程序结构: // 我从主机端调用一个主内核 err = clEnqueueNDRangeKernel(队列, main_kernel, 1, NULL, globalSize_g, 0, 0, NULL, NULL); // 然后在设备端...

回答 1 投票 0

如何理解下面的asm?

__global__ void TEST_prog(int *data_in1, int *data_in2, int *data_out) // 使用 IF 函数 { 无符号整型 tid = (blockIdx.x * blockDim.x) + threadIdx.x; data_out[tid] = data_in1[tid] + dat...

回答 1 投票 0

OpenCL 动态并行 enqueue_kernel() 功能

我正在尝试使用 OpenCL 2.0 提供的功能从内核内部调用内核,但似乎无法使其工作。 例如我有这些内核: __内核无效测试2(){ 原则...

回答 1 投票 0

OpenCL 找不到 Intel HD 4000

我会提前警告你我的书面英语不好,所以请耐心等待,因为我会犯很多错误。 我需要暴露显卡才能进行一些基准测试...

回答 1 投票 0

在执行完成之前将参数传递给 OpenCL 内核

我有以下关于执行 OpenCL 内核的问题。令 kernel 为某个 OpenCL 内核。我想用不同的参数执行它两次。 我可以在调用后为此内核设置新参数吗...

回答 1 投票 0

CUDA 内核,用于查找一维数组中大于特定阈值的最小和最大索引值

我正在尝试编写一个 CUDA 内核,用于查找一维数组中大于特定阈值的最小和最大索引值 下面是 CPU 中执行相同操作的伪代码 int min_index ...

回答 1 投票 0

用C++在GPU上执行向量计算,无论品牌如何

如何在 GPU 上执行计算(并将结果分配给变量),无论其品牌如何(AMD、Nvidia,甚至 iGPU)? 我想要最简单、最高效的 API,我可以...

回答 1 投票 0

为什么 mac 上的 webgpu“最大绑定大小”比报告的“最大缓冲区大小”小得多?

我正在使用 Chrome 在高端 Mac 笔记本电脑上开发一个基于 WebGPU 的库。 该库主要设计用于实现计算着色器管道以进行操作 显微镜和其他 3D 体积

回答 2 投票 0

Windows 中使用 Radeon Pro VII 的 GPGPU

我从问题开始,以防有人可以在不浏览整篇文章的情况下说些什么: 在 Windows 中开始使用 C++ 进行 Radeon Pro VII 编程的最简单方法是什么? 对于任何...

回答 1 投票 0

在金属着色语言(MSL)中,如何在地址空间上编写通用的按引用传递函数?

我正在为 Metal 计算着色器编写 Foo 类,并希望用户能够添加 Foo,无论他们驻留在哪个地址空间。如果我通过参考获取这些值,这意味着我必须

回答 1 投票 0

我真的可以启动库内核(CUkernel)而不是上下文内核(CUfunction)吗?

在 CUDA 12.0 中,添加了对从磁盘或内存动态加载内核库的支持:驱动程序 API,第 6.12 节库管理。从这些库中,我们可以加载“kern...

回答 1 投票 0

opencl命令队列是如何工作的,我能要求它做什么

我正在研究一种算法,它可以多次执行几乎相同的操作。由于该操作由一些线性代数(BLAS)组成,我想我会尝试使用 GPU 来完成此操作。 我已经...

回答 2 投票 0

Metal - 优化内存访问

这个问题有两个部分,但它们密切相关: 问题1 Metal 是否提供了一种利用共享线程组内存的方法? 例如,在 CUDA 中,您可以显式地从 de...

回答 2 投票 0

PyCuda中如何使用共享内存,LogicError: cuModuleLoadDataEx failed:遇到非法内存访问

我试图了解如何使用 PyCuda 处理共享内存。运行此代码来翻转输入向量: 将 pycuda.driver 导入为 drv 将 pycuda.gpuarray 导入为 gpuarray 导入 pycuda.autoini...

回答 1 投票 0

这个 GPU 计算或着色器模式叫什么(如果有的话)?

首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...

回答 1 投票 0

安装 vortex 时出现 libhwloc.so.5 错误

安装所有依赖项后在 vortex 中尝试“make”时,出现以下错误: /usr/bin/ld:警告:/opt/pocl/runtime/lib/libOpenCL.so 需要的 libhwloc.so.5,未找到(尝试

回答 1 投票 0

使用 Imagination IMG GPU 清除 OpenCL 缓冲区

我可以在 Intel、NVIDIA 和 AMD GPU 上使用 clEnqueueFillBuffer() 成功清除 OpenCL 缓冲区对象。 当我尝试在 Imagination IMG GPU 上执行相同操作时,我的程序出现段错误。 它可能...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.