cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

在 nvcuda.dll 中找不到 cudaDeviceSynchronize()

我正在编写CUDA代码,在VS2022中使用nvcc编译它,生成PTX文件,并从Embarcadero Delphi运行CUDA代码。为了从 Delphi 运行 CUDA 内核,我编写了一个 API

回答 1 投票 0

pycuda 找不到内核 cuModuleGetFunction 失败:未找到命名符号

我有以下脚本尝试在图像上绘制矩形 导入CV2 将 numpy 导入为 np 导入 pycuda.autoinit 将 pycuda.driver 导入为 cuda 从 pycuda.compiler 导入 SourceModule 定义

回答 1 投票 0

从 std::deque 复制到推力 device_vector

我正在尝试制作一个示例代码,从 std::deque 复制到推力::device_vector,但编译器警告不允许从 __host__ __device__ 函数调用 __host__ 函数(我...

回答 1 投票 0

CUDA 编译器无法检测到(GPU)设备上调用的主机函数

请看这段代码: 无效栏(){} __host__ __device__ 无效 foo() { 酒吧(); } __global__ 无效内核() { foo(); } int main() { 内核<<<1, 1>>>(); gpuErrchk(

回答 2 投票 0

每次我想将GPU与Tensorflow(WSL)一起使用时都必须导出CUDNN_PATH

我遇到的问题是,在安装最新版本的 Tensorflow (2.16.1) 时,它没有使用 GPU。 仅在运行以下命令后,它才能识别 GPU(如本中所建议的...

回答 1 投票 0

`ptxas 警告:Tensorflow 和 PyTorch 上的寄存器溢出到本地内存

在我们的一项研究中,我们将 Tensorflow 和 Pytorch 与其他主要模型一起使用。每当我们在大学使用数据服务器时,我们都可以在模型训练中使用完整的 GPU。电脑上有一个

回答 1 投票 0

尝试从另一个文件的全局函数调用设备函数

作为 GPU 编程(以及某种 CMake)的初学者,我一直在尝试使用 CMake 和 CUDA 制作一个小项目,但我遇到了问题,所以我想知道一种执行以下操作的方法: 好吧,让...

回答 1 投票 0

numba.cuda.close()之后如何使用GPU?

我在jupyter笔记本上使用tensorflow。假设我想刷新 GPU 内存中的所有内容而不重新启动内核(这意味着不触及 RAM 内容)。请不要潜入

回答 1 投票 0

在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时出现问题,net.forward();

我在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时遇到问题。我在 Windows 11 中使用 Visual Studio 2022,并使用 CUDA 12.1 和 CUDN 配置了 OpenCV 4.8.0...

回答 1 投票 0

__grid_constant__ 参数限定符有什么作用?

几周前,NVIDIA 的 Stephen Jones 进行了一场题为“CUDA:新功能及超越”的 GTC 演讲,其中他介绍了 CUDA v11.7 中即将推出的功能:内核限定符/装饰器

回答 1 投票 0

并行归约算法中的共享内存库冲突

我正在阅读 Nvidia 的幻灯片(优化 CUDA 中的并行缩减),讨论并行缩减算法。 幻灯片 15: 在这里,作者讨论了通过使用顺序寻址,我们

回答 2 投票 0

CUDA使用NVIDA卡,视频使用主板

我想使用主板作为主显示适配器,并使用 NVIDIA 显卡作为专用 CUDA 处理器。我的第一个想法是简单地将显示器的 VGA 线插入主板......

回答 4 投票 0

在设备函数 CUDA 中引用倾斜指针

我已经使用 cudaMalloc3D 使用 cudaPitchedPtr 创建了一个 3D 矩阵,我也想从设备函数引用创建的矩阵。是否将倾斜指针复制到 __device__

回答 1 投票 0

如何在 CUDA 中有效地设置位向量的位?

任务类似于如何并行有效地设置位向量的位?,但是对于 CUDA。 考虑其中有 N 位的位向量(N 很大,例如 4G)和 M 个数字的数组(M 也很大,例如...

回答 1 投票 0

使用未启用 CUDA 的 GPU 进行深度学习

我的笔记本电脑上有 Nvidia GeForce GTX 1650。它没有启用cuda。我可以将此 GPU 与 TensorFlow 和 pytorch 一起使用吗?除了 CUDA 之外还有什么可以使用的吗? 我尝试安装不同的版本...

回答 1 投票 0

nvidia/cuda和tensorflow/tensorflow图像之间的区别

从 GPU 支持的角度来看,tensorflow/tensorflow 图像与 nvidia/cuda docker 图像有什么根本不同?我不关心例如Python 的东西。比如说我...

回答 1 投票 0

为每个线程CUDA动态分配内存

我需要为每个线程分配一个数组,但数组的长度只有在运行时才知道。一旦计算出数组长度,它就是一个常数值。 cudaMalloc 似乎无法在...

回答 1 投票 0

如何使用C头文件和CUDA代码编译C代码?

我有一个使用一些库的主要代码,我一直这样编译它: gcc 导入CFile1.c 导入CFile2.c mainCode.c -O3 -lm -Wall -o maincode -lrt 现在我已经在 mainCo 中添加了 CUDA 代码...

回答 1 投票 0

在 Ubuntu 上的 Docker 上使用带有 GPU 的 TensorFlow

我已经为下面写的问题苦苦挣扎了很多天,希望你能帮助我。 我想做的是在 Ubuntu 上的 Docker 上使用带有 GPU 的 Tensorflow。 我的 GPU 是 GeForce GTX 1070,并且我...

回答 1 投票 0

无法成功实现多CUDA GPU的并行缩减

我尝试运行以下代码来计算两个向量的点积,当GPU的输入数量为1时,即没有真正使用Omp包的时候,代码可以很好地运行。 ..

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.