gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写,被称为“图形处理单元(GPU)上的通用计算”

CUDA根据字大小合并了内存访问速度

我有一个CUDA程序,其中一个warp需要访问(例如)96字节的全局内存。它正确地对齐内存位置和通道索引,以便访问合并并在...中完成

回答 1 投票 1

检索某些顶点到CPU的最快跨平台方法是什么?

我正在开发一个应用程序,我将相机姿势传递给GPU,后者将生成包含有关物体可见椎体的不同信息的纹理(法线深度...)基于这些信息,我......

回答 1 投票 0

如何使用OpenGL ES对三角形像素求和

我是OpenGL ES的新手。我目前正在阅读有关2.0版OpenGL ES的文档。我有一个三角形的2D网格,一个2D RGB纹理,我需要为每个三角形计算以下数量:...

回答 1 投票 1

使用cudaMallocManaged时,为什么NVIDIA Pascal GPU在运行CUDA内核时会变慢

我正在测试新的CUDA 8以及Pascal Titan X GPU,并期待我的代码加速,但由于某种原因它最终会变慢。我在Ubuntu 16.04上。这是最小的代码......

回答 3 投票 10

如何在复杂算法中看到GPU的瓶颈?

我正在使用GLSL片段着色器进行GPGPU计算(我有我的理由)。在nSight中,我看到我每帧都要做1600次抽调。可能存在3个瓶颈:Fillrate太多的drawcalls ......

回答 2 投票 3

如何使用Thrust减少数组中不连续的数字段

我有一个数组“A”,它由许多数组“a”组成,如下所示:我正在实现一个代码来总结非连续的段(总结每个段中相同颜色的段中的数字...

回答 1 投票 0

什么是openCL范围尺寸?

我认为计算加速器(GPU)是一些SP - “流处理器”,每个都包含一些固定数量的ALU核心,以SIMD方式运行。但不像CPU线程,SP ...

回答 2 投票 0

随机访问gpgpu性能下降?

我听说在gpu上对随机访问的数组执行计算时性能会下降。我的问题是这种性能下降有多严重?搜索一些评论......

回答 1 投票 -2

在OpenCL中,平台,上下文和设备之间有什么区别?

我是OpenCL编程的新手。设备,上下文和平台有什么区别?

回答 1 投票 13

获取有关NVidia上已编译的OpenCL内核的详细信息

有没有办法获得有关如何在NVidia平台(或其他平台)上编译OpenCL内核的详细信息。可以放入内核的外部工具或测试。 ...

回答 1 投票 0

Numpy element-wise dot产品没有循环和内存错误

我正在处理一个简单的问题与numpy。我有两个矩阵列表 - 比如A,B - 分别编码为具有形状(n,p,q)和(n,q,r)的3D阵列。我想计算他们的元素点...

回答 2 投票 2

是否可以在AMD GPU上运行CUDA?

我想将我的技能扩展到GPU计算。我熟悉光线跟踪和实时图形(OpenGL),但下一代图形和高性能计算似乎都在GPU中......

回答 5 投票 43

为什么opencl规范为CLK_FILTER_LINEAR减去0.5

在阅读关于CLK_FILTER_LINEAR的OpenCL 1.1规范(第8.2节,第258页)时,我开始知道,为了计算双线性滤波器的权重,将减去0.5,如下所示。 i0 = address_mode((...

回答 1 投票 0

有关GPGPU库的建议

我正在编写一个应用程序,最终它得到了很好的并行化部分:二维float initialData和结果数组中每个单元格(a,b)的结果数组:对于每个单元格(i,j)...

回答 1 投票 0

Titan Z vs K40处理器?

我正在使用GPU进行科学计算。最近Nvidia发布了旗舰产品GeForce Titan Z.我想知道,这款处理器如何与特斯拉K40(另一款NVIDIA产品)展开竞争。一世 ...

回答 2 投票 2

Metal - 一个线程本地的命名空间变量?

我正在尝试在Metal中创建一个伪随机数生成器(PRNG),类似于推力的RNG,每次在一个线程内调用RNG时,它会产生一个给定特定的不同随机数...

回答 1 投票 1

ELF或PE加载程序是否支持GPU部分,或者某些操作系统是否有实现此功能的计划?

ELF或PE加载器是否支持GPU部分?我的意思是特殊的部分类型,将被操作系统识别,然后将其映射到GPU MCU(内存控制器单元)以及主MC表....

回答 3 投票 -1

我的pyCuda索引是如何工作的?

我正在尝试将一个3d数组加载到pycuda(我要加载图像)。我希望每个线程使用for循环处理单个像素的所有通道(这是算法要求)。到目前为止我......

回答 1 投票 0

假设检验和GPGPU

我是GPGPU和编程的新手。我很想知道统计假设测试如单样本Kolmogorov-Smirnov测试(K-S测试)和Levene测试是否可以在GPGPU(SIMD)中实现...

回答 1 投票 2

无法并行化OpenACC循环

我有一个用FORTRAN编写的旧代码,我需要使用OpenACC来加速它,但是当我尝试使用指令时,它说un,vn,pn依赖于阻止并行性。是否有可能 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.