cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

将使用malloc制作的阵列传递给cuda

我对c ++很新,甚至更多cuda。如果这个问题在其他地方明显得到解答,我很抱歉。我尽力搜索答案基础,但最接近的答案我......

回答 1 投票 -3

在numba中cuda.local.array的正确用法是什么?

我使用numba在python中编写了一个测试代码。来自numba import cuda import numpy as np import numba @ cuda.jit def function(output,size,random_array):i_p,i_k1,i_k2 = cuda.grid(3)a = cuda ....

回答 1 投票 0

CUDA构建共享库

我需要为cuda创建一个共享库。该库的编译工作正常,但当我尝试在我的程序中使用它时,nvcc返回一个链接器或ptxas错误。我把问题减少到......

回答 1 投票 1

如何使用CUDA并行化嵌套for循环以在2D数组上执行计算

我正在进行一些研究,并且非常适合使用CUDA。我使用的语言是C和C ++,这是与Nvidia的CUDA兼容的基本语言。在过去的一周里,我一直坚持......

回答 1 投票 0

为什么CUDA会在访问课程成员时崩溃?

对不起,如果这是一个新问题,但我找不到它。我一直在编写一个可以使用CDUA加速的程序。但是,我的方法很大程度上依赖于类对象的传递(完全,...

回答 1 投票 0

使用CUDA推力的元素动力操作

有没有办法用pow函数转换推力矢量?换句话说,我想用向量将向量的每个元素x转换为pow(x,a)。

回答 2 投票 2

cudaStream_t有多大?

我继承了一些基本上做这样的代码的代码:void * stream; cudaStreamCreate((cudaStream_t *)&stream);查看CUDA 8的targets / x86_64-linux / driver_types.h,我看到:...

回答 1 投票 1

为什么CUDA内核无法在带有CUDA 9.0的VS 2013中启动

我在Windows(GeForce GT 720M)中编写了一个基于CUDA的并行程序。我已经安装了CUDA 9.0 Toolkit和Visual Studio 2013.一切正常,但是当我编译代码并运行它时......

回答 2 投票 2

numba和tensorflow一起给出了CUDA_ERROR_OUT_OF_MEMORY

我在python中使用了numba和tensorflow来计算3-d循环问题。首先,我多次使用numba来准备输入数据,一切都很好。然后我用tensorflow来深入...

回答 1 投票 -2

使用cusparse Csrmv_mp但使用cusparse Csrmv的正确结果时得到错误的结果

我正在尝试对Csrmv_mp函数进行简单测试。我有一个工作程序,但我得到一个特定的矩阵向量的错误结果。如果我运行完全相同的程序,但...

回答 1 投票 0

为什么这个numba.cuda查找表实现失败?

我正在尝试实现一个转换,它在某个阶段有一个<1K的查找表。在我看来,它似乎不应该对现代显卡造成问题。但是下面的代码是......

回答 1 投票 1

设备代码中CUDA类静态成员的成语?

所以,我有一个C ++ 14库,我正在移植到CUDA 9.我实际上(我认为)对CUDA非常了解,但是自从CUDA 6以来我没有做过任何直接的工作。通常,我使用了很多......

回答 2 投票 3

OpenACC中的嵌套指令

我正在尝试使用OpenACC的嵌套功能来激活我的gpu卡的动态并行性。我有特斯拉40c和我的OpenACC编译器是PGI版本15.7。我的代码很简单。当我尝试编译时......

回答 2 投票 1

CUDA模板错误:没有函数模板的实例与参数列表匹配

编译错误,我无法弄清楚。我的函数调用似乎与参数列表匹配。 nvcc -o main main.cu错误:没有函数模板实例“gemm_template_batched_nn_kernel”匹配...

回答 1 投票 0

尝试使用CUDA运行deeplearning4j时找不到依赖库

我正在尝试使用GPU运行使用dl4j构建的神经网络。使用本机平台依赖项时代码工作正常,但是当我切换到使用CUDA时,执行失败并出现异常:...

回答 1 投票 1

从命令行运行nvcc时出现问题

我需要从命令行使用nvcc编译cuda .cu文件。该文件是“vectorAdd_kernel.cu”并包含以下代码:extern“C”__global__ void VecAdd_kernel(const float * A,...

回答 2 投票 6

我可以在Linux Mint 18(Cinnamon)上安装CUDA工具包吗?

我可以在Linux Mint 18.1 Serena(Cinnamon桌面环境)上安装CUDA工具包吗?我问这个是因为它没有列在支持的操作系统列表中,即使它具有相同的架构...

回答 1 投票 -1

CUDA内核包装器的共享库未定义引用

所以我试图在Windows上使用带有Go的cgo的CUDA Runtime API。我已经在这里呆了几天而且卡住了:我得到了一个未定义的引用我的内核包装器。我分开了......

回答 1 投票 1

Tensorflow CUDA减少Op没有完全减少

我用C ++和CUDA编写的TensorFlow r1.5操作的一部分涉及减少Tensor。我已经实现了简单的交错缩减算法,如此处所述。但是,......

回答 1 投票 1

“CudaLaunch返回(0x9)”,以及程序计时问题

我写了一个CUDA程序,我有两个关于这个程序的问题。当我调用内核函数时,我知道block_len必须<= 1024,但我仍然设置block_len> 1024.当我用cuda -...调试时

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.