CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。
我有程序,它在CUDA中生成素数并在第138行程序崩溃:cudaMemcpy(gpudata,data,sizeof(int)* MAXSIZE,cudaMemcpyHostToDevice);我收到了该行的“堆栈溢出”错误....
Visual Studio 2017 msvc vs nvcc __cplusplus宏不匹配
我使用的是Visual Studio 2017,平台工具集v141和CUDA Toolkit 9.2。我注意到在使用nvcc编译thrust :: device_vector时,不存在移动构造函数和移动赋值。 ......
我收到消息:“cutilCheckMsg()CUTIL CUDA错误:内核启动失败:CUDA驱动程序版本不足以用于CUDA运行时版本。”在尝试运行示例源代码时。还......
我正在比较两个预先训练的模型,一个在Tensorflow中,另一个在Pytorch中,在具有多个GPU的机器上。每个型号都适合一个GPU。它们都加载在相同的Python脚本中。怎么样 ...
我通过conda安装了pytorch cuda 7.5 conda install pytorch = 0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available()真的我没有做任何其他安装......
当我编译我的cuda文件时:nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v,-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...
我遇到了一个关于将cudaMemcpy与cudaMemcpyDeviceToHost一起使用的问题。有一个结构有一个指针int * a,它将在内核函数中使用malloc。然后我需要将此int * a复制到主机...
我为每个块选择了64个或更多的线程数(128个块),用于将两个大小为8192的矩阵乘以8192。我得到的只是我矩阵中的0。你能告诉我它的原因吗? ...
NVCC正在返回一个错误,但几乎没有信息可以继续。在转向所谓的“现代cmake”之前,该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...
我正在使用“CUDA bu Example”一书来开始使用CUDA。但是当我包含书中给出的所有头文件然后得到ERROR为错误1错误LNK1104:无法打开文件'glut32.lib'D:\ book \ book \ ...
如何在开普勒实施全球原子操作?我使用gmem而不是使用原子来降低性能
我想知道开普勒全局原子的实现。看到这段代码:1。if(threadIdx.x <workers){2。temp = atomicAdd(dst,temp + rangeOffset); 3.如果(...
在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么?
我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解,当使用NVCC的-gencode选项时,“arch”是最小的计算...
我想使用CUDA开发一个程序,但我在NVidia网站上的安装说明中迷失了方向。所以这就是我所拥有的:带有NVidia GPU GeForce GTX 870M的Windows 10笔记本电脑(OS和GPU ......
Tensorflow:我安装了CUDA 9.2但它需要9.0?
我按照书中的说明安装了CUDA Toolkit 9.2版。然后我收到此错误ImportError:找不到'cudart64_90.dll'。 TensorFlow要求将此DLL安装在...
cudaMallocManaged with vector > C ++ - NVIDIA CUDA
我正在通过NVIDIA GeForce GT 650M GPU实现多线程,以实现我创建的模拟。为了确保一切正常,我创建了一些侧面代码......
我正在尝试如何在numba中使用cuda。但是我遇到了一些与我的期望不同的东西。这是我的代码来自numba import cuda @ cuda.jit def matmul(A,B,C):“”执行......
nvcc致命:不支持的gpu架构'compute_20'而cuda 9.1 + caffe + openCV 3.4.0已安装
我安装了CUDA 9.1 + cudnn-9.1 + opencv 3.4.0 + caffe。当我尝试在caffe目录中运行make all -j8时,发生了以下错误:nvcc致命:不支持的gpu体系结构'compute_20'我有......
Numba和guvectorize for CUDA目标:代码运行速度低于预期
值得注意的细节大数据集(1000万x 5),(200 x 1000万x 5)Numpy大部分在每次运行后都需要更长时间使用Spyder3 Windows 10首先要尝试使用guvectorize与...