cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

无论如何,opencv使用cuda内存

我想知道我的代码使用CUDA的速度有多快,所以我使用以下开关编译OpenCV(包括cuda)cmake CMAKE_BUILD_TYPE = RELEASE \ CMAKE_INSTALL_PREFIX = / usr / local \ WITH_CUDA = ON \ ...

回答 1 投票 0

Pycuda Blocks和Grids可以处理大数据

我需要帮助才能知道我的块和网格的大小。我正在构建一个python应用程序来执行基于scipy的度量计算:Euclidean distance,Manhattan,Pearson,Cosine,加入其他。 ......

回答 2 投票 3

使用Cuda平行降维(3D到2D,总和)

在CUDA应用程序中,我有一个N x N x D矩阵,我希望通过对整个第一(或第二)轴求和来减少到N x D.我如何最有效地完成这项工作?通常,N大于......

回答 2 投票 1

magmablas_dgemm不适用于更大的网格尺寸

我是新手使用cuda和岩浆库。我正在尝试测试问题的一些函数,2D热方程。我写的代码似乎适用于32,64和128的网格大小。但它...

回答 1 投票 1

如何在现有Eclipse中安装CUDA NSight?

我有一个安装了一堆插件的现有eclipse,所以我想知道:是否可以在现有的eclipse安装中安装cuda nsight?如果是这样,怎么样?

回答 1 投票 3

CUDA并行化数组工作

我是CUDA的新手,我刚读过一些关于CUDA的NVIDIA导师,我需要一些帮助。有以下代码://部分包括#define NUM_OF_ACCOMS 3360 #define SIZE_RING 16 #define ...

回答 1 投票 -3

CUDA动态并行中的同步

我正在使用以下内核测试动态并行性,该内核使用动态并行性以分而治之的方式获取整数数组的最大值:__ global__ void getMax(...

回答 1 投票 0

使用C ++ 11时CUDA nvcc编译器失败(Linux; clang 3.8)

我正在尝试使用我的Debian GNU / Linux系统上的CUDA工具包进行编译,但即使在非常简单的程序中,C ++ 11支持显然已被破坏。首先,这是相关软件列表......

回答 2 投票 1

合并列表与CUDA中的重复键

假设我们有一个结构列表graph_node *:struct graph_node {int from; int to;浮动概率;现在,假设在列表中重复了几个.from和.to元素。例如:我们可以......

回答 1 投票 -3

GPU编程策略

我正在尝试使用CUDA中的c编程一种神经网络。我有一个基本问题。对于编程,我可以使用大数组或不同的命名策略。例如,对于权重,......

回答 2 投票 2

PyCUDA NPP库兼容性

我一直在尝试通过Python访问Nvidia Performance Primitives库,我发现了一个非常有用的教程,最后在2011年更新了这个站点:http://openvidia.sourceforge.net/index.php / ...

回答 1 投票 2

即使在初始化结果参数之后,CUDA atomicAdd也会产生错误的结果

atomicAdd产生错误的结果。我甚至在设备中初始化结果但仍然无法正常工作。这是为什么?这是我调用的函数:__ global__ void getHammingDistance(char * str1,char * str2,int ...

回答 1 投票 0

CUDA:struct的共享数据成员和该struct的引用成员具有不同的地址,值

接下来是问题:使用CUDA 1.1计算gpu,我试图维护一组(每个线程可能不同数量,这里固定为4个)索引,这是我作为...的成员保留的引用。

回答 1 投票 1

NVCC -arch -code

我对NVCC文档感到困惑:3.2.7。指导GPU代码生成的选项nvcc -arch = compute_50 -code = sm_50,compute_50(相当于nvcc -arch = sm_50)之间的区别是什么...

回答 1 投票 0

是否可以在Thrust仿函数中调用设备函数?

我想在推力仿函数中调用一个设备函数,但是甚至不知道如何启动。这是一个显而易见的需求,因为有些情况下仿函数的大小很大,因此需要......

回答 1 投票 0

计算内核的网格和块尺寸

假设您要编写一个对大小为400x900像素的图像进行操作的内核。您还想为每个像素分配一个GPU线程。你的线程块是方形的,你想使用最大...

回答 2 投票 0

CUDA:重载共享内存以实现具有多个数组的简化方法

我有5个大尺寸数组A(N * 5),B(N * 5),C(N * 5),D(N * 5),E(N * 2)数字5和2代表这些变量的组成部分在不同的平面/轴上。这就是为什么我在这个结构数组...

回答 1 投票 1

将包含向量的结构传递给CUDA内核

我有一个大型代码,我需要将结构传递给CUDA内核,该内核具有大量的参数和向量的整数。我无法弄清楚如何将结构传递给CUDA内核。我有 ...

回答 1 投票 1

Caffe:训练后的GPU CUDA错误:检查失败:错误== cudaSuccess(30 vs. 0)未知错误

有时在训练之后或当我通过按CTRL + C手动停止训练时我得到这个cuda错误:检查失败:错误== cudaSuccess(30对0)未知错误这只是开始发生...

回答 6 投票 2

使用PyCUDA和固定内存的dot产品

我目前正在使用PyCUDA处理带有固定内存的点积。我有大阵列的问题。我正在使用:NVIDIA GTX 1060 CUDA 9.1 PyCUDA 2017.1.1代码是:#!/ usr / bin / ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.