gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写,被称为“图形处理单元(GPU)上的通用计算”

在 Linux 上使用 SYCL/DPC++ 的离散英特尔 GPU 上一次分配不能分配超过 256MB

当尝试在 Linux 上使用 SYCL/DPC++ 在离散英特尔 GPU 上分配超过 256MB 时,我收到运行时错误并且程序立即退出,尽管有更多

回答 1 投票 0

禁用CUDA编译器驱动程序的二进制缓存

我注意到通过编译器驱动(驱动版本:440.64)编译CUDAOpenCL,在第一次编译内核后,编译时间快了10倍。因此,驱动程序缓存生成的...

回答 1 投票 0

Nsight在VS10中跳过(忽略)断点 Cuda工作正常,nsight一直跳过几个断点。

我用的是nsight 2.2,Toolkit 4.2,最新的nvidia驱动,我的电脑里用的是几个GPU。Build customize 4.2. 我在CUDA的项目属性中设置了 "generate GPU ouput",nsight监控器打开了(...

回答 4 投票 5

什么是GPU Context,NVIDIA架构中的GPU硬件通道?

在阅读一些与GPU计算相关的论文时,我对GPU上下文和GPU硬件通道这两个术语的理解出现了问题,下面是对它们的简单介绍,但我不明白它们是什么。

回答 1 投票 2

CUDA上下文寿命

在我的应用程序中,我有一些部分的代码,工作原理如下main.cpp int main() { /第一维度通常很小(1-10) /第二维度(100 - 1500) /第三维度(10000 - ...

回答 1 投票 -1

计算着色器。为什么是RWTexture2d<float4>?

我有一个ID3D11Texture2D和ID3D11UnorderedAccessView,格式为DXGI_FORMAT_R8G8B8A8_UNORM,着色器为RWTexture2d。 tex: register(u0); [numthreads(32, 32, 1)] void main(uint3 dtid : ...)

回答 1 投票 0

高效地将多维数组传输到CUDA GPU[封闭式]。

如何将一个定义类似于数组 "A "的(一种)多维数组(即int********A;)在C语言中把多维数组转换为单维数组的过程转移到CUDA GPU ...

回答 1 投票 1

OpenCL 2.0设备命令队列不断被填满并停止执行。

我正在利用OpenCL的enqueue_kernel()函数从GPU动态地enqueue内核,以减少不必要的主机交互。下面是一个简化的例子,说明了我在GPU中试图做的事情。

回答 1 投票 0

为诗人进行TensorFlow训练期间GPU利用率为0%

我正在遵循有关诗人的TensorFlow再培训的说明。 GPU利用率似乎很低,所以我按照《使用GPU》中的说明检测了retrain.py脚本。日志验证TF ...

回答 2 投票 5

[CUDA驱动程序API与2020年的运行时API

[十年前,关于CUDA驱动程序API与运行时API的优缺点存在很大的疑问。显然已经过去了很多时间,我想知道发生了多少变化。 ...

回答 1 投票 2

cuda threadfence

我正在编写必须执行块间同步(N个维和其他内存传输操作的总和)的代码。当我增加问题的范围时,结果是错误的。 ...

回答 1 投票 3

了解CL_DEVICE_MAX_WORK_GROUP_SIZE限制OpenCL?

我有点难理解OpenCL报告的最大工作组限制及其对程序的影响。所以我的程序正在报告以下内容,CL_DEVICE_MAX_WORK_ITEM_SIZES:...

回答 1 投票 0

如何将多个重复的参数传递给CUDA内核

我正在寻找一种优雅的方式来在CUDA内核中传递多个重复的参数,众所周知,每个内核参数都位于每个CUDA线程的堆栈上,因此,可能会有...

回答 1 投票 -1

CUDA是否有Lisp扩展名?

我刚刚注意到,W.D。Hillis的Connection-Machine的第一种语言是* Lisp,它是Common Lisp的并行结构扩展。连接机器是一个大规模并行...

回答 4 投票 17

为什么在CUDA中有翘曲级同步原语?

我对CUDA中的__syncwarp()有两个问题:如果我理解正确,则将在SIMD功能中执行CUDA中的扭曲。难道不意味着扭曲中的所有线程都始终同步吗? ...

回答 1 投票 0

OpenCL的select运算符对什么有用?

我注意到OpenCL具有select()函数/ builtin / operator,它似乎与C和C ++中的三元运算符相似,但不完全相同。 select()和?:和...

回答 1 投票 1

使用GLSL计算着色器渲染纹理时遇到麻烦

我已经查看了其他人的实现,但仍然不确定自己在做什么错。我的图形驱动程序是最新的,并且没有收到错误消息。我正在尝试使用GLSL计算...

回答 1 投票 0

使用XNA访问GPGPU进行图像处理

我正在使用C#进行一些实时图像处理项目,并且我希望尽可能多地利用GPU。具体来说,我有几个byte []包含原始位图数据,我需要做...

回答 2 投票 4

CUDA速度比预期的慢-图像处理

我是CUDA开发的新手,想编写一个简单的基准来测试某些图像处理的可行性。我有32个图像,每个图像均为720x540,每像素灰度一个字节。我正在跑步...

回答 1 投票 0

您可以使用Apple的Metal进行通用GPU编程吗?

我有CUDA的经验,但我一直想知道是否可以在Mac上使用Metal替代OpenCL来实现高性能计算。似乎没有很多...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.