gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写，被称为“图形处理单元（GPU）上的通用计算”

我想使用GPUgem中的指令编写一个大型数组的前缀扫描，这是我的并行类的作业。我确实遵循了书中的所有步骤，但我的代码仍然无法工作。我得到了...

cuda gpgpu prefix-sum

回答 1 投票 0

有什么区别无效 glDispatchCompute(1, 1, 1); 布局（local_size_x = 100，local_size_y = 100，local_size_z = 1）中；和无效 glDispatchCompute(100, 100, 1); 布局（local_si...

opengl gpgpu compute-shader

回答 1 投票 0

使用多个 GPU OpenCL

我有一个循环，在其中将多个内核启动到 GPU 上。下面是片段： for (int idx = 开始; idx <= end ;idx ++) { ret = clEnqueueNDRangeKernel(command_queue,

opencl gpgpu

回答 2 投票 0

OpenCL 如何在从主机读取结果之前等待设备端队列完成

这是我简化的程序结构： // 我从主机端调用一个主内核 err = clEnqueueNDRangeKernel(队列, main_kernel, 1, NULL, globalSize_g, 0, 0, NULL, NULL); // 然后在设备端...

c opencl gpgpu

回答 1 投票 0

如何理解下面的asm？

__global__ void TEST_prog(int *data_in1, int *data_in2, int *data_out) // 使用 IF 函数 { 无符号整型 tid = (blockIdx.x * blockDim.x) + threadIdx.x; data_out[tid] = data_in1[tid] + dat...

cuda gpgpu

回答 1 投票 0

OpenCL 动态并行 enqueue_kernel() 功能

我正在尝试使用 OpenCL 2.0 提供的功能从内核内部调用内核，但似乎无法使其工作。例如我有这些内核： __内核无效测试2（）{ 原则...

c++ c opencl gpgpu amd-gpu

回答 1 投票 0

OpenCL 找不到 Intel HD 4000

我会提前警告你我的书面英语不好，所以请耐心等待，因为我会犯很多错误。我需要暴露显卡才能进行一些基准测试...

c++ opencl gpgpu

回答 1 投票 0

在执行完成之前将参数传递给 OpenCL 内核

我有以下关于执行 OpenCL 内核的问题。令 kernel 为某个 OpenCL 内核。我想用不同的参数执行它两次。我可以在调用后为此内核设置新参数吗...

synchronization opencl gpgpu

回答 1 投票 0

CUDA 内核，用于查找一维数组中大于特定阈值的最小和最大索引值

我正在尝试编写一个 CUDA 内核，用于查找一维数组中大于特定阈值的最小和最大索引值下面是 CPU 中执行相同操作的伪代码 int min_index ...

performance cuda gpgpu reduction

回答 1 投票 0

用C++在GPU上执行向量计算，无论品牌如何

如何在 GPU 上执行计算（并将结果分配给变量），无论其品牌如何（AMD、Nvidia，甚至 iGPU）？我想要最简单、最高效的 API，我可以...

c++ graphics 3d gpgpu

回答 1 投票 0

为什么 mac 上的 webgpu“最大绑定大小”比报告的“最大缓冲区大小”小得多？

我正在使用 Chrome 在高端 Mac 笔记本电脑上开发一个基于 WebGPU 的库。该库主要设计用于实现计算着色器管道以进行操作显微镜和其他 3D 体积

google-chrome gpu gpgpu metal webgpu

回答 2 投票 0

Windows 中使用 Radeon Pro VII 的 GPGPU

我从问题开始，以防有人可以在不浏览整篇文章的情况下说些什么：在 Windows 中开始使用 C++ 进行 Radeon Pro VII 编程的最简单方法是什么？对于任何...

opencl gpgpu amd sycl

回答 1 投票 0

在金属着色语言（MSL）中，如何在地址空间上编写通用的按引用传递函数？

我正在为 Metal 计算着色器编写 Foo 类，并希望用户能够添加 Foo，无论他们驻留在哪个地址空间。如果我通过参考获取这些值，这意味着我必须

gpgpu metal compute-shader

回答 1 投票 0

我真的可以启动库内核（CUkernel）而不是上下文内核（CUfunction）吗？

在 CUDA 12.0 中，添加了对从磁盘或内存动态加载内核库的支持：驱动程序 API，第 6.12 节库管理。从这些库中，我们可以加载“kern...

cuda gpgpu

回答 1 投票 0

opencl命令队列是如何工作的，我能要求它做什么

我正在研究一种算法，它可以多次执行几乎相同的操作。由于该操作由一些线性代数（BLAS）组成，我想我会尝试使用 GPU 来完成此操作。我已经...

c++ c cuda opencl gpgpu

回答 2 投票 0

Metal - 优化内存访问

这个问题有两个部分，但它们密切相关：问题1 Metal 是否提供了一种利用共享线程组内存的方法？例如，在 CUDA 中，您可以显式地从 de...

ios gpu gpgpu metal

回答 2 投票 0

PyCuda中如何使用共享内存，LogicError: cuModuleLoadDataEx failed:遇到非法内存访问

我试图了解如何使用 PyCuda 处理共享内存。运行此代码来翻转输入向量：将 pycuda.driver 导入为 drv 将 pycuda.gpuarray 导入为 gpuarray 导入 pycuda.autoini...

python cuda gpu gpgpu pycuda

回答 1 投票 0

这个 GPU 计算或着色器模式叫什么（如果有的话）？

首先，请注意，这同样可以应用于编写 GPGPU 代码的图形着色器，尽管我的兴趣是 GPGPU，这就是示例代码“类似计算”的原因。我们都知道G...

cuda gpu shader opencl gpgpu

回答 1 投票 0

安装 vortex 时出现 libhwloc.so.5 错误

安装所有依赖项后在 vortex 中尝试“make”时，出现以下错误： /usr/bin/ld：警告：/opt/pocl/runtime/lib/libOpenCL.so 需要的 libhwloc.so.5，未找到（尝试

llvm opencl gpgpu pocl

回答 1 投票 0

使用 Imagination IMG GPU 清除 OpenCL 缓冲区

我可以在 Intel、NVIDIA 和 AMD GPU 上使用 clEnqueueFillBuffer() 成功清除 OpenCL 缓冲区对象。当我尝试在 Imagination IMG GPU 上执行相同操作时，我的程序出现段错误。它可能...

opencl gpgpu

回答 1 投票 0

gpgpu 相关问题

最新问题