cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

KYDER是超人

chainer.cuda.available和chainer.cuda.cudnn_enabled都返回'True'。但是当我尝试cuda.to_gpu(data,1)时,它会出现以下错误 - CUDARuntimeError ...

回答 1 投票 0

如何使翘曲导致另一个翘曲处于空闲状态?

正如你在问题的标题中看到的那样,我想知道一个warp如何导致另一个warp进入Idle状态。我在SO中读了很多Q / A,但我找不到答案。在任何时候,只有一个......

回答 1 投票 0

使用带有Eigen的CUDA时找不到math_functions.hpp

我有一些严重依赖于Eigen的代码。我想用CUDA来优化它,但是当我编译时,我得到:[tcai4 @ golubh4 Try1] $ nvcc conv_parallel.cu -I / home / tcai4 / project-cse / Try1 -...

回答 2 投票 3

动态数组获取“错误代码未指定启动失败”

我想在我的内核中用c变量使用动态数组,但是当我使用超过1个threa的线程时,我总是得到这个错误“错误代码未指定启动失败”。如果我评论这个代码c [...

回答 1 投票 -2

CUDA在内核代码中多次乘法运算

矩阵乘法的函数:__ global__ void gpu_matrix_mult(float * a,float * b,float * c,int m,int n,int k){int row = blockIdx.y * blockDim.y + threadIdx.y; int col = blockIdx.x * ...

回答 1 投票 0

Qt5中的Cuda Link错误

I'm starting to use Cuda 8.0 in Qt5.8 with Qt creator with Visual Studio 2015 x64 on Windows 10 and I got unresolved symbols like: cuda_code_cuda.o : error LNK2019: 澷朄夝愅捏奜晹晞崋atexit丆cuda_code_cuda. o ...

回答 1 投票 0

使用cuda c减少计算数组的总和

我遇到的一个问题是,当我运行我的cuda程序时,总是说在第167行的stats_gpu.cu中遇到了非法的内存访问。代码如下:#include

回答 1 投票 -2

Cuda不能将类拆分为头和实现

我有下一个文件Kernel.cu #include“cuda_runtime.h”#include“device_launch_parameters.h”#include #包括 #包括 #include&...

回答 1 投票 -1

CUDA内核调用:内核<< >>其中第三个“

我使用CUDA 9.1和visual stdio 2017 15.4.4来加速计算,当我在visual stdio中编辑代码时遇到了一些问题。虽然我可以正确编译项目,但第三个“&...

回答 1 投票 -1

thrust :: sort_by_key上的配置参数无效

我在尝试使用sort_by_key时遇到问题:我在终端中收到以下错误:在抛出'thrust :: system :: system_error'之后调用终止what():在cub _ :: ...之后

回答 1 投票 0

使用CUSP打印矩阵的csr格式

我正在尝试使用CUSP和CUDA将稀疏矩阵转换为csr格式。我稍微修改了CUSP文档中显示的代码:#include #包括 ...

回答 1 投票 -1

无法为cufftComplex数据类型分配CUDA设备内存

我正在尝试使用以下代码将cufftComplex数组分配到CUDA设备(GEFORCE GTX 1080)的内存中:cufftComplex * d_in,* d_out; int ds = sizeof(cufftComplex)* width * height; ...

回答 1 投票 -1

在Linux上找到CUDA安装

什么是最好的方式?以下是我的解决方案:echo $ PATH | sed“s /:/ \ n / g”| grep“cuda / bin”| sed“s / \ / bin // g”|头-n 1哪个nvcc | sed“s / \ / bin \ / nvcc //”其中nvcc | head -c -10他们都是......

回答 1 投票 4

将数据从寄存器复制到全局存储器

我是编写CUDA的初学者。我不明白如何将数据从寄存器复制或传输到全局内存。谁能举个例子?谢谢

回答 1 投票 -3

没有GPU的Nvcc

我正试图从更快的RCNN获得一个区域提案。我在github中发现了这个漂亮而又整洁的repo,但每当我执行shell命令时,sh make.sh,它会吐出一个cffi.error.VerificationError:...

回答 1 投票 0

使用gcc和nvcc编译时,eigen :: matrix反转的行为不同

我使用Eigen进行矩阵求逆(下面提供的代码)(让我们称之为inversion.cpp)。 Inversion.cpp用g ++编译并给出正确的逆。现在我将代码名称更改为Inversion.cu并尝试...

回答 1 投票 1

不允许通过从__host__ __device__函数调用__host__函数来编译推力集差异

我有两组A和B分别为20和10整数。 B是A的子集。我需要找到B的免费集合。我使用thrust :: set_difference找到集合差异,但它...

回答 1 投票 -1

GPU cuda代码可以在多个GPU卡上运行而无需任何实现吗?

我已经有一个基于GPU CUDA C ++的代码,可以在单个NVIDIA显卡上运行良好。是否可以通过添加新的NVIDIA卡来加速计算并在2个GPU卡上运行代码(...

回答 1 投票 -1

基于共享存储器的1d模板CUDA实现中的负数组索引

我目前正在使用CUDA编程,我正在尝试从我在网上找到的工作室学习幻灯片,可以在这里找到。我遇到的问题是幻灯片48.下面的代码......

回答 4 投票 6

为什么CUDA程序可以使用CMake“FIND_PACKAGE”,但不能使用“LANGUAGES CUDA”?

注意:之前的标题是“如何使用CMake编译CUDA程序,而不使用FIND_PACKAGE?”。编辑使关键问题更清晰。当以建议的方式使用CMake和CUDA时,......

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.