CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。
我想知道我的代码使用CUDA的速度有多快,所以我使用以下开关编译OpenCV(包括cuda)cmake CMAKE_BUILD_TYPE = RELEASE \ CMAKE_INSTALL_PREFIX = / usr / local \ WITH_CUDA = ON \ ...
我需要帮助才能知道我的块和网格的大小。我正在构建一个python应用程序来执行基于scipy的度量计算:Euclidean distance,Manhattan,Pearson,Cosine,加入其他。 ......
在CUDA应用程序中,我有一个N x N x D矩阵,我希望通过对整个第一(或第二)轴求和来减少到N x D.我如何最有效地完成这项工作?通常,N大于......
我是新手使用cuda和岩浆库。我正在尝试测试问题的一些函数,2D热方程。我写的代码似乎适用于32,64和128的网格大小。但它...
我有一个安装了一堆插件的现有eclipse,所以我想知道:是否可以在现有的eclipse安装中安装cuda nsight?如果是这样,怎么样?
我是CUDA的新手,我刚读过一些关于CUDA的NVIDIA导师,我需要一些帮助。有以下代码://部分包括#define NUM_OF_ACCOMS 3360 #define SIZE_RING 16 #define ...
我正在使用以下内核测试动态并行性,该内核使用动态并行性以分而治之的方式获取整数数组的最大值:__ global__ void getMax(...
使用C ++ 11时CUDA nvcc编译器失败(Linux; clang 3.8)
我正在尝试使用我的Debian GNU / Linux系统上的CUDA工具包进行编译,但即使在非常简单的程序中,C ++ 11支持显然已被破坏。首先,这是相关软件列表......
假设我们有一个结构列表graph_node *:struct graph_node {int from; int to;浮动概率;现在,假设在列表中重复了几个.from和.to元素。例如:我们可以......
我一直在尝试通过Python访问Nvidia Performance Primitives库,我发现了一个非常有用的教程,最后在2011年更新了这个站点:http://openvidia.sourceforge.net/index.php / ...
即使在初始化结果参数之后,CUDA atomicAdd也会产生错误的结果
atomicAdd产生错误的结果。我甚至在设备中初始化结果但仍然无法正常工作。这是为什么?这是我调用的函数:__ global__ void getHammingDistance(char * str1,char * str2,int ...
CUDA:struct的共享数据成员和该struct的引用成员具有不同的地址,值
接下来是问题:使用CUDA 1.1计算gpu,我试图维护一组(每个线程可能不同数量,这里固定为4个)索引,这是我作为...的成员保留的引用。
我对NVCC文档感到困惑:3.2.7。指导GPU代码生成的选项nvcc -arch = compute_50 -code = sm_50,compute_50(相当于nvcc -arch = sm_50)之间的区别是什么...
我想在推力仿函数中调用一个设备函数,但是甚至不知道如何启动。这是一个显而易见的需求,因为有些情况下仿函数的大小很大,因此需要......
我有5个大尺寸数组A(N * 5),B(N * 5),C(N * 5),D(N * 5),E(N * 2)数字5和2代表这些变量的组成部分在不同的平面/轴上。这就是为什么我在这个结构数组...
我有一个大型代码,我需要将结构传递给CUDA内核,该内核具有大量的参数和向量的整数。我无法弄清楚如何将结构传递给CUDA内核。我有 ...
Caffe:训练后的GPU CUDA错误:检查失败:错误== cudaSuccess(30 vs. 0)未知错误
有时在训练之后或当我通过按CTRL + C手动停止训练时我得到这个cuda错误:检查失败:错误== cudaSuccess(30对0)未知错误这只是开始发生...
我目前正在使用PyCUDA处理带有固定内存的点积。我有大阵列的问题。我正在使用:NVIDIA GTX 1060 CUDA 9.1 PyCUDA 2017.1.1代码是:#!/ usr / bin / ...