cublas 相关问题

NVIDIA CUDA基本线性代数子程序(cuBLAS)库是完整标准BLAS库的GPU加速版本,可与支持CUDA的GPU一起使用。


ImportError:libcublas.so.8.0:无法打开共享对象文件:没有这样的文件或目录(共享Linux)

我是tensorflow的新手,我正在使用共享linux(Ubuntu 16.04),这意味着我没有root访问权限。 Cuda 8.0和Cudnn 8已由管理员以root身份安装。我已经安装了python 3.5 ...

回答 1 投票 3

Cublas - 列/行明智的操作

我正在寻找一种在列上执行操作的方法。我有MxN矩阵,我想在每列上激活cublas函数(例如nrm2)。我期望获得的结果是:M x 1怎么能......

回答 1 投票 0

无法创建cudnn句柄:CUBLAS_STATUS_ALLOC_FAILED

我正在尝试运行我在GitHub上找到的这个气球分割模型:https://github.com/matterport/Mask_RCNN/tree/master/samples/balloon。它运行在我的linux虚拟机上,但非常非常......

回答 1 投票 1

与cublas的tensorflow运行错误

当我在群集上成功安装tensorflow时,我立即运行mnist demo来检查它是否正常,但在这里我想出了一个问题。我不知道这是什么,但看起来......

回答 2 投票 5

Tensorflow:ImportError:libcublas.so.9.0

我安装了Tensorflow。当我尝试导入它时:导入tensorflow因为我得到以下问题:ImportError:libcublas.so.9.0:无法打开共享对象文件:没有这样的文件或目录我有...

回答 2 投票 0

cuBLAS Dgemm产品与python

我有两个简单的矩阵A和B,我正在计算它们的乘法。数组看起来像这样(使用numpy作为模型)A = np.array(([1,2,3],[4,5,6]))。astype(np.float64)B = np.array(( [7,8],[9,...

回答 2 投票 1

由于“无效参数”,Cublas编程程序命中了cudaErrorInvalidValue

最近,我尝试用Cublas库编写GPU编程。我所做的只是在设备上分配内存并进行矩阵计算。但是,当我尝试按以下方式分配内存时,我......

回答 1 投票 0

RTX 2080钛CUDA-MEMCHECK创造CUBLAS上下文开始打错误

我在两个1080 GTX Ti和RTX 2080钛运行同一程序。我发现,当我尝试使用CUDA的MEMCHECK工具来检查我的计划,我根据设备RTX 2080缇总是有以下错误。 == ...

回答 2 投票 0

CUBLAS转置矩阵乘法问题

我正在尝试在CUBLAS中乘以C = At *B。问题是,使用我拥有的代码(从中获取),有些矩阵维度似乎可以正常工作int rows_a = ...

回答 1 投票 0

为什么cublas复制算法在cuda中这么快?

我编写了将输入向量复制到输出向量的内核。但是与cublascopy API相比,性能还不够。对于1M个元素,cublasScopy比我的内核快100倍。...

回答 1 投票 0
推荐问题