cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

CUDA管道异步内存从全局复制到共享内存

我目前正在学习如何编写快速的 CUDA 内核。我实现了一个平铺矩阵乘法(块大小 32x32),它仅从/向全局内存进行合并读取/写入,并且没有存储组配置...

回答 2 投票 0

如何将 cudaArray 转换为 Torch 张量?

我正在尝试使用 Torch 和 CUDA。使用 torch::from_blob() 到目前为止,我能够执行以下操作: #包括 #包括 #包括 #inc...

回答 1 投票 0

‘/tmp/tmpxft_0000120b_0000000-10_my_program”中对‘cublasCreate_v2’的未定义引用

我尝试在NVIDIA Tesla P100显卡(Ubuntu版本16.04)上使用CUDA 9.0工具包编译代码,代码中使用了CUBLAS库。为了编译,我使用了以下com...

回答 1 投票 0

无法在rhel8容器中安装特定版本的nvidia驱动程序

我正在尝试使用此存储库安装特定版本的 nvidia 驱动程序: https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rehl8.repo 在运行 nv 的 docker 容器中...

回答 1 投票 0

CUDA 调用图

我正在尝试为埃及的 CUDA 中的代码生成调用图,但通常的方法似乎不起作用(因为 nvcc 没有任何标志可以执行与 -fdump-rtl 相同的操作-展开...

回答 2 投票 0

是否可以有一个持久的cuda内核异步运行并与cpu通信?

据我所知,Cuda流和memorycpyasync需要我们将不同的内核、内存操作标记到不同的流中,以使gpu操作与cpu操作并发。 布...

回答 1 投票 0

相同类型的多个模板声明的目的

我遇到过一个具有多个声明的代码库,并且只有一个 CUDA 内核密度(...) 模板 __global__ void Density<5>(int width, int height); 模板 __global__ v...

回答 1 投票 0

CUDA 上的配对重复数据删除

我已经在 CUDA 上运行了一个数据结构并收集数据如下: 结构SearchDataOnDevice { size_t npair; int * id1; int * id2; }; 我想删除重复的 id p...

回答 1 投票 0

matlab mex文件中的矩阵乘法代码与CUDA代码,但结果是0。有人知道原因吗?

我用cuda代码在matlab mex文件中编写了一段代码。该代码的功能是计算矩阵-矩阵乘法,当我输入两个矩阵,大小为MN和NK时,结果都是0(M * K),但是我不知道...

回答 1 投票 0

Tensorflow GPU CUDA 无法加载动态库“libcufft.so.10”;错误

我担心这会被标记为重复,但我找到了 libcudart 或 libcublas 的示例,但没有找到 libcufft (这是我的问题)。 我安装了 TensorFlow,并且想使用 GPU。因此,我运行...

回答 1 投票 0

为什么我收到“__constant__ 变量不支持动态初始化”?

我有以下结构: enum BoundSide { 右、左、上、下、后、前 }; 模板 使用 vec = 数组; //fpr 短静态向量场 li...

回答 2 投票 0

无输入函数的最佳 CUDA 线程/块计数(随机采样)

关于优化 CUDA 函数中的线程和块的数量有很多问题,但我发现的所有内容都是关于将它们与问题大小相匹配。 我有任务,没问题...

回答 1 投票 0

CUDA独立线程调度饥饿

这个 NVIDIA 官方博客在“无饥饿算法”部分声称 Volta 中的 ITS 添加了对无饥饿算法的支持,并提供了一些细节。这个官方文档...

回答 1 投票 0

CUDA 和 JAX 库不兼容

我的CUDA版本是11.6。 JAX的版本是0.4.16,jaxlib的版本是0.4.16+cuda11.cudnn86。 当我运行简单的 Python 代码时,出现错误消息 W 外部/xla/xla/服务/gpu/

回答 1 投票 0

cuda.h 和 cudpp.h 有什么区别?我使用的是 4.2 版本,cudpp 不起作用。

cuda.h中cudpp.h有对应的函数吗: CUDPP处理Cudpp; cudppCreate(&theCudpp); CUDPP配置配置; config.op = CUDPP_ADD; 配置.数据类型 =

回答 1 投票 0

CUDA中是否有相当于intptr_t和uintptr_t的东西

由于 intptr_t 和 uintptr_t 指的是能够保存主机指针的整数类型,是否有一些可以在设备代码中使用的等效项? 这对于设备端特别有用......

回答 1 投票 0

针对旧版 GPU 的 CUDA -arch,同时仅编译调用 CUDA API 或第三方库的主机代码

假设当传递 -arch=sm_35 时,安装的 CUDA 版本仅支持我的旧 GPU。否则,内核不会执行。 假设我现在只在我的...中调用 CUDA Runtime API(cudaMalloc、cudaFree 等)

回答 1 投票 0

2D Cuda 网格内核中的 Cupy 索引?

我正在尝试开始使用 Cupy 进行一些 Cuda 编程。 我需要编写自己的内核。然而,我在 2D 内核方面遇到了困难。看来 Cupy 并没有按照我的预期工作。 这是一个非常

回答 2 投票 0

与 Turing 相反,CudaMalloc 不分配给 Ampere 微架构上的共享 GPU 内存

我正在使用 CUDA Toolkit 11.8 - 操作系统 - Windows。 该程序是在 Windows 上使用 Nvidia T1200 编译的。 我使用带有标志的 CMAKE 3.15.7: CMAKE_CUDA_ARCH_BIN:3.5 5.0 5.2 5.3 6.0 6.1 6.2 7.0...

回答 1 投票 0

CUDA编译器无法编译简单的测试程序

我正在尝试获取 NVIDIA 的 CUDA 设置并将其安装在我的配有 NVIDIA GEFORCE RTX 2080 SUPER 显卡的电脑上。经过几个小时的尝试不同的事情和大量的研究后,我得到了 CUD...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.