cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

为什么CUDA会在访问课程成员时崩溃?

对不起,如果这是一个新问题,但我找不到它。我一直在编写一个可以使用CDUA加速的程序。但是,我的方法很大程度上依赖于类对象的传递(完全,...

回答 1 投票 0

使用CUDA推力的元素动力操作

有没有办法用pow函数转换推力矢量?换句话说,我想用向量将向量的每个元素x转换为pow(x,a)。

回答 2 投票 2

cudaStream_t有多大?

我继承了一些基本上做这样的代码的代码:void * stream; cudaStreamCreate((cudaStream_t *)&stream);查看CUDA 8的targets / x86_64-linux / driver_types.h,我看到:...

回答 1 投票 1

为什么CUDA内核无法在带有CUDA 9.0的VS 2013中启动

我在Windows(GeForce GT 720M)中编写了一个基于CUDA的并行程序。我已经安装了CUDA 9.0 Toolkit和Visual Studio 2013.一切正常,但是当我编译代码并运行它时......

回答 2 投票 2

numba和tensorflow一起给出了CUDA_ERROR_OUT_OF_MEMORY

我在python中使用了numba和tensorflow来计算3-d循环问题。首先,我多次使用numba来准备输入数据,一切都很好。然后我用tensorflow来深入...

回答 1 投票 -2

使用cusparse Csrmv_mp但使用cusparse Csrmv的正确结果时得到错误的结果

我正在尝试对Csrmv_mp函数进行简单测试。我有一个工作程序,但我得到一个特定的矩阵向量的错误结果。如果我运行完全相同的程序,但...

回答 1 投票 0

为什么这个numba.cuda查找表实现失败?

我正在尝试实现一个转换,它在某个阶段有一个<1K的查找表。在我看来,它似乎不应该对现代显卡造成问题。但是下面的代码是......

回答 1 投票 1

设备代码中CUDA类静态成员的成语?

所以,我有一个C ++ 14库,我正在移植到CUDA 9.我实际上(我认为)对CUDA非常了解,但是自从CUDA 6以来我没有做过任何直接的工作。通常,我使用了很多......

回答 2 投票 3

OpenACC中的嵌套指令

我正在尝试使用OpenACC的嵌套功能来激活我的gpu卡的动态并行性。我有特斯拉40c和我的OpenACC编译器是PGI版本15.7。我的代码很简单。当我尝试编译时......

回答 2 投票 1

CUDA模板错误:没有函数模板的实例与参数列表匹配

编译错误,我无法弄清楚。我的函数调用似乎与参数列表匹配。 nvcc -o main main.cu错误:没有函数模板实例“gemm_template_batched_nn_kernel”匹配...

回答 1 投票 0

尝试使用CUDA运行deeplearning4j时找不到依赖库

我正在尝试使用GPU运行使用dl4j构建的神经网络。使用本机平台依赖项时代码工作正常,但是当我切换到使用CUDA时,执行失败并出现异常:...

回答 1 投票 1

从命令行运行nvcc时出现问题

我需要从命令行使用nvcc编译cuda .cu文件。该文件是“vectorAdd_kernel.cu”并包含以下代码:extern“C”__global__ void VecAdd_kernel(const float * A,...

回答 2 投票 6

我可以在Linux Mint 18(Cinnamon)上安装CUDA工具包吗?

我可以在Linux Mint 18.1 Serena(Cinnamon桌面环境)上安装CUDA工具包吗?我问这个是因为它没有列在支持的操作系统列表中,即使它具有相同的架构...

回答 1 投票 -1

CUDA内核包装器的共享库未定义引用

所以我试图在Windows上使用带有Go的cgo的CUDA Runtime API。我已经在这里呆了几天而且卡住了:我得到了一个未定义的引用我的内核包装器。我分开了......

回答 1 投票 1

Tensorflow CUDA减少Op没有完全减少

我用C ++和CUDA编写的TensorFlow r1.5操作的一部分涉及减少Tensor。我已经实现了简单的交错缩减算法,如此处所述。但是,......

回答 1 投票 1

“CudaLaunch返回(0x9)”,以及程序计时问题

我写了一个CUDA程序,我有两个关于这个程序的问题。当我调用内核函数时,我知道block_len必须<= 1024,但我仍然设置block_len> 1024.当我用cuda -...调试时

回答 1 投票 1

KYDER是超人

chainer.cuda.available和chainer.cuda.cudnn_enabled都返回'True'。但是当我尝试cuda.to_gpu(data,1)时,它会出现以下错误 - CUDARuntimeError ...

回答 1 投票 0

如何使翘曲导致另一个翘曲处于空闲状态?

正如你在问题的标题中看到的那样,我想知道一个warp如何导致另一个warp进入Idle状态。我在SO中读了很多Q / A,但我找不到答案。在任何时候,只有一个......

回答 1 投票 0

使用带有Eigen的CUDA时找不到math_functions.hpp

我有一些严重依赖于Eigen的代码。我想用CUDA来优化它,但是当我编译时,我得到:[tcai4 @ golubh4 Try1] $ nvcc conv_parallel.cu -I / home / tcai4 / project-cse / Try1 -...

回答 2 投票 3

动态数组获取“错误代码未指定启动失败”

我想在我的内核中用c变量使用动态数组,但是当我使用超过1个threa的线程时,我总是得到这个错误“错误代码未指定启动失败”。如果我评论这个代码c [...

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.