cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

CUDA内核包装器的共享库未定义引用

所以我试图在Windows上使用带有Go的cgo的CUDA Runtime API。我已经在这里呆了几天而且卡住了:我得到了一个未定义的引用我的内核包装器。我分开了......

回答 1 投票 1

Tensorflow CUDA减少Op没有完全减少

我用C ++和CUDA编写的TensorFlow r1.5操作的一部分涉及减少Tensor。我已经实现了简单的交错缩减算法,如此处所述。但是,......

回答 1 投票 1

“CudaLaunch返回(0x9)”,以及程序计时问题

我写了一个CUDA程序,我有两个关于这个程序的问题。当我调用内核函数时,我知道block_len必须<= 1024,但我仍然设置block_len> 1024.当我用cuda -...调试时

回答 1 投票 1

KYDER是超人

chainer.cuda.available和chainer.cuda.cudnn_enabled都返回'True'。但是当我尝试cuda.to_gpu(data,1)时,它会出现以下错误 - CUDARuntimeError ...

回答 1 投票 0

如何使翘曲导致另一个翘曲处于空闲状态?

正如你在问题的标题中看到的那样,我想知道一个warp如何导致另一个warp进入Idle状态。我在SO中读了很多Q / A,但我找不到答案。在任何时候,只有一个......

回答 1 投票 0

使用带有Eigen的CUDA时找不到math_functions.hpp

我有一些严重依赖于Eigen的代码。我想用CUDA来优化它,但是当我编译时,我得到:[tcai4 @ golubh4 Try1] $ nvcc conv_parallel.cu -I / home / tcai4 / project-cse / Try1 -...

回答 2 投票 3

动态数组获取“错误代码未指定启动失败”

我想在我的内核中用c变量使用动态数组,但是当我使用超过1个threa的线程时,我总是得到这个错误“错误代码未指定启动失败”。如果我评论这个代码c [...

回答 1 投票 -2

CUDA在内核代码中多次乘法运算

矩阵乘法的函数:__ global__ void gpu_matrix_mult(float * a,float * b,float * c,int m,int n,int k){int row = blockIdx.y * blockDim.y + threadIdx.y; int col = blockIdx.x * ...

回答 1 投票 0

Qt5中的Cuda Link错误

I'm starting to use Cuda 8.0 in Qt5.8 with Qt creator with Visual Studio 2015 x64 on Windows 10 and I got unresolved symbols like: cuda_code_cuda.o : error LNK2019: 澷朄夝愅捏奜晹晞崋atexit丆cuda_code_cuda. o ...

回答 1 投票 0

使用cuda c减少计算数组的总和

我遇到的一个问题是,当我运行我的cuda程序时,总是说在第167行的stats_gpu.cu中遇到了非法的内存访问。代码如下:#include

回答 1 投票 -2

Cuda不能将类拆分为头和实现

我有下一个文件Kernel.cu #include“cuda_runtime.h”#include“device_launch_parameters.h”#include #包括 #包括 #include&...

回答 1 投票 -1

CUDA内核调用:内核<< >>其中第三个“

我使用CUDA 9.1和visual stdio 2017 15.4.4来加速计算,当我在visual stdio中编辑代码时遇到了一些问题。虽然我可以正确编译项目,但第三个“&...

回答 1 投票 -1

thrust :: sort_by_key上的配置参数无效

我在尝试使用sort_by_key时遇到问题:我在终端中收到以下错误:在抛出'thrust :: system :: system_error'之后调用终止what():在cub _ :: ...之后

回答 1 投票 0

使用CUSP打印矩阵的csr格式

我正在尝试使用CUSP和CUDA将稀疏矩阵转换为csr格式。我稍微修改了CUSP文档中显示的代码:#include #包括 ...

回答 1 投票 -1

无法为cufftComplex数据类型分配CUDA设备内存

我正在尝试使用以下代码将cufftComplex数组分配到CUDA设备(GEFORCE GTX 1080)的内存中:cufftComplex * d_in,* d_out; int ds = sizeof(cufftComplex)* width * height; ...

回答 1 投票 -1

在Linux上找到CUDA安装

什么是最好的方式?以下是我的解决方案:echo $ PATH | sed“s /:/ \ n / g”| grep“cuda / bin”| sed“s / \ / bin // g”|头-n 1哪个nvcc | sed“s / \ / bin \ / nvcc //”其中nvcc | head -c -10他们都是......

回答 1 投票 4

将数据从寄存器复制到全局存储器

我是编写CUDA的初学者。我不明白如何将数据从寄存器复制或传输到全局内存。谁能举个例子?谢谢

回答 1 投票 -3

没有GPU的Nvcc

我正试图从更快的RCNN获得一个区域提案。我在github中发现了这个漂亮而又整洁的repo,但每当我执行shell命令时,sh make.sh,它会吐出一个cffi.error.VerificationError:...

回答 1 投票 0

使用gcc和nvcc编译时,eigen :: matrix反转的行为不同

我使用Eigen进行矩阵求逆(下面提供的代码)(让我们称之为inversion.cpp)。 Inversion.cpp用g ++编译并给出正确的逆。现在我将代码名称更改为Inversion.cu并尝试...

回答 1 投票 1

不允许通过从__host__ __device__函数调用__host__函数来编译推力集差异

我有两组A和B分别为20和10整数。 B是A的子集。我需要找到B的免费集合。我使用thrust :: set_difference找到集合差异,但它...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.