cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

用于生成素数的程序,错误:“堆栈溢出”[关闭]

我有程序,它在CUDA中生成素数并在第138行程序崩溃:cudaMemcpy(gpudata,data,sizeof(int)* MAXSIZE,cudaMemcpyHostToDevice);我收到了该行的“堆栈溢出”错误....

回答 1 投票 -4

Visual Studio 2017 msvc vs nvcc __cplusplus宏不匹配

我使用的是Visual Studio 2017,平台工具集v141和CUDA Toolkit 9.2。我注意到在使用nvcc编译thrust :: device_vector时,不存在移动构造函数和移动赋值。 ......

回答 1 投票 0

CUDA驱动程序版本不足以用于CUDA运行时版本

我收到消息:“cutilCheckMsg()CUTIL CUDA错误:内核启动失败:CUDA驱动程序版本不足以用于CUDA运行时版本。”在尝试运行示例源代码时。还......

回答 7 投票 22

为Torch和Tensorflow分配两个独立的GPU

我正在比较两个预先训练的模型,一个在Tensorflow中,另一个在Pytorch中,在具有多个GPU的机器上。每个型号都适合一个GPU。它们都加载在相同的Python脚本中。怎么样 ...

回答 1 投票 0

在pytorch安装的CUDA HOME

我通过conda安装了pytorch cuda 7.5 conda install pytorch = 0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available()真的我没有做任何其他安装......

回答 1 投票 1

如何解释ptx函数名称

当我编译我的cuda文件时:nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v,-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...

回答 1 投票 1

cuda从设备内存中复制内核中动态malloc的数据

我遇到了一个关于将cudaMemcpy与cudaMemcpyDeviceToHost一起使用的问题。有一个结构有一个指针int * a,它将在内核函数中使用malloc。然后我需要将此int * a复制到主机...

回答 1 投票 0

在没有平铺的情况下为矩阵乘法内核选择每个块的线程数和块数

我为每个块选择了64个或更多的线程数(128个块),用于将两个大小为8192的矩阵乘以8192。我得到的只是我矩阵中的0。你能告诉我它的原因吗? ...

回答 1 投票 -2

随机访问gpgpu性能下降?

我听说在gpu上对随机访问的数组执行计算时性能会下降。我的问题是这种性能下降有多严重?搜索一些评论......

回答 1 投票 -2

NVCC unistd.h(792):错误:预期标识符

NVCC正在返回一个错误,但几乎没有信息可以继续。在转向所谓的“现代cmake”之前,该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...

回答 1 投票 0

LNK1104:无法打开文件'glut32.lib'

我正在使用“CUDA bu Example”一书来开始使用CUDA。但是当我包含书中给出的所有头文件然后得到ERROR为错误1错误LNK1104:无法打开文件'glut32.lib'D:\ book \ book \ ...

回答 4 投票 1

如何在开普勒实施全球原子操作?我使用gmem而不是使用原子来降低性能

我想知道开普勒全局原子的实现。看到这段代码:1。if(threadIdx.x <workers){2。temp = atomicAdd(dst,temp + rangeOffset); 3.如果(...

回答 2 投票 1

在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么?

我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解,当使用NVCC的-gencode选项时,“arch”是最小的计算...

回答 2 投票 30

VS2017和GTX 870M的CUDA版本是什么?

我想使用CUDA开发一个程序,但我在NVidia网站上的安装说明中迷失了方向。所以这就是我所拥有的:带有NVidia GPU GeForce GTX 870M的Windows 10笔记本电脑(OS和GPU ......

回答 1 投票 0

Tensorflow:我安装了CUDA 9.2但它需要9.0?

我按照书中的说明安装了CUDA Toolkit 9.2版。然后我收到此错误ImportError:找不到'cudart64_90.dll'。 TensorFlow要求将此DLL安装在...

回答 5 投票 12

cudaMallocManaged with vector > C ++ - NVIDIA CUDA

我正在通过NVIDIA GeForce GT 650M GPU实现多线程,以实现我创建的模拟。为了确保一切正常,我创建了一些侧面代码......

回答 1 投票 0

为什么numba cuda在几次回忆之后运行缓慢?

我正在尝试如何在numba中使用cuda。但是我遇到了一些与我的期望不同的东西。这是我的代码来自numba import cuda @ cuda.jit def matmul(A,B,C):“”执行......

回答 1 投票 1

nvcc致命:不支持的gpu架构'compute_20'而cuda 9.1 + caffe + openCV 3.4.0已安装

我安装了CUDA 9.1 + cudnn-9.1 + opencv 3.4.0 + caffe。当我尝试在caffe目录中运行make all -j8时,发生了以下错误:nvcc致命:不支持的gpu体系结构'compute_20'我有......

回答 1 投票 6

Numba和guvectorize for CUDA目标:代码运行速度低于预期

值得注意的细节大数据集(1000万x 5),(200 x 1000万x 5)Numpy大部分在每次运行后都需要更长时间使用Spyder3 Windows 10首先要尝试使用guvectorize与...

回答 2 投票 1

基本的cuda共享内存

我是cuda的新手并且有一些关于共享内存的问题:每个SM在同一个GPU中是否拥有相同数量的共享内存? SM如何在...之间划分共享内存?

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.