cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

ModuleNotFoundError:没有名为“nvcc_plugin”的模块

我正在尝试在 Colab 上使用 cuda c,遵循了设置 cuda c 的整个过程,我遇到的唯一问题是加载扩展 ModuleNotFoundError:没有名为“nvcc_plugin”的模块 (https...

回答 1 投票 0

CUDA 统一内存是否可以解决较新 GPU 上的数据移动问题?

CUDA统一内存如何处理数据移动? 假设我有一个看起来像这样的程序 - cudaMallocManaged(&y, ...); 主机内核(y); 设备内核(y); 主机内核(y); 设备内核(...

回答 1 投票 0

为什么有时相同的内核执行速度要慢 10 倍?

代码如下: // 默认流,1000 个块 cudaEventRecord(start1); kernel_gpu<<<1000, dim3{32, 32, 1}>>>(); cudaEventRecord(stop1); // 流1,100个块 cudaEventRecord(s...

回答 1 投票 0

来自 cuLaunchKernel() 的意外 CUDA_ERROR_INVALID_VALUE

我正在尝试使用 CUDA 驱动程序 API 启动内核。具体我打电话 CUResult CUDAAPI cuLaunchKernel( CU 函数 f, 无符号整型 gridDimX、无符号整型 gridDimY、无符号整型

回答 2 投票 0

如何获取CPU时间线中的Cuda事件时间?

这是伪代码: // 之前的代码也调用内核 for(int i{0}; i < n; ++i){ auto& startEvent = startEvents[i]; auto& stopEvent = stopEvents[i]; cudaEventRecord(

回答 1 投票 0

如何将 FFmpeg AVFrame 中的 CUdeviceptr 平面复制到我自己的 CUDA 内存中?

我试图将FFmpeg(CUDA)解码的帧平面复制到我自己的CUDA内存中,但我尝试了很多次,但都失败了。 1,来自 FFmpeg 文档,它说: /// HW 加速通过... 我试图将FFmpeg(CUDA)解码的帧平面复制到我自己的CUDA内存中,但我尝试了很多次,但都失败了。 1,来自 FFmpeg 文档,它说: /// <summary>HW acceleration through CUDA. data[i] contain CUdeviceptr pointers exactly as for system memory frames.</summary> @AV_PIX_FMT_CUDA = 117 这意味着 AVFrame.data[n] 是要复制的 CUdeviceptr。 2,我已经毫无问题地创建了自己的 CUDA 内存: var dstPtr = new CUdeviceptr(); var error = cuMemAlloc_v2(ref dstPtr, length); 3、尝试从AVFrame复制到dstPtr,但失败了: var dstPtr = new CUdeviceptr(); var error = cuMemAlloc_v2(ref dstPtr, length); // allocate a CUDA mem for test var plane = ffmpeg.av_frame_get_plane_buffer(avFrame, 0); // get the plane 0 info var srcPtr = new CUdeviceptr((long)plane->data); // get CUdeviceptr from data[0] error = cuMemcpyDtoD_v2(dstPtr, srcPtr, plane->size); // try to copy from avFrame into my own CUDA mem block Debug.Assert(error == CUResult.Success); // alway fail..... 复制结果一直是ErrorInvalidValue表示从AVFrame.data[0]返回的CUdeviceptr无效什么的.... 我真的不知道我做错了什么...... 顺便说一句,我已经创建了一个用于内存分配的 CUDA 上下文,也就是说,我将在分配内存之前将自己的 CUDA 上下文设置为当前上下文,此操作是否会破坏 FFmpeg 的当前上下文?那么副本会失败吗? 但是无论如何,无论我使用cuCtxPushCurrent_v2还是cuCtxSetCurrent,都不起作用。 这只是一个非常简单的复制测试,不是吗?但为什么......:( 答案很简单:使 FFmpeg 的 CUcontext 正确当前。

回答 1 投票 0

SNN 模型在每次迭代后都会变慢,然后耗尽内存

我正在实现全卷积网络(UNet)的尖峰版本。我测试了没有 LIF 神经元的正常模型,虽然它非常占用内存,但效果很好,所以我必须使用

回答 1 投票 0

CUDA Nvidia GTX 1650 |蟒蛇

我正在尝试做一些基于人工智能的Python工作,并希望通过cuda将压力从CPU转移到GPU,这样我的程序就会运行得更流畅。 系统: NVIDIA GTX 1650 笔记本电脑 I5-9300H WINDWONS 10 主页 ...

回答 1 投票 0

包括GPU库的路径问题

我正在尝试使用 MAGMA (http://icl.cs.utk.edu/magma/) 在 GPU 上执行一些矩阵运算。我能够成功调用 CUDA 内核,并且没有任何问题。但当我...

回答 2 投票 0

CUDA 错误后重置 GPU 和驱动程序

有时,我的 CUDA 程序中的错误会导致桌面图形损坏(在 Windows 中)。通常,屏幕仍然具有一定的可读性,但是当图形发生变化时,例如拖动窗口时,很多...

回答 6 投票 0

在 CUDA 中,执行分块求和的正确方法是什么?

假设我想找到本地 int X 的块和。简单的方法是仅使用atomicAdd 和 __shared__ 变量: __device__ int blocksum(int x) { __shared__ int 总和; ...

回答 1 投票 0

在VS2008中构建CUDA程序出现问题:LNK2019

我在构建程序时遇到了一些麻烦。我正在使用 Visual Studio 2008 处理 Windows 7 professional 32 位。我有 Cuda SDK,并且我的项目设置了 cudart.l 的所有链接...

回答 3 投票 0

如何在.cpp文件中包含<cuda_runtime.h>

我在 .cpp 文件中包含 时遇到问题。错误:无法包含文件:cuda_runtime.h:没有这样的文件或目录。 我正在尝试编译 Rob Farber 的代码(http://www.drdob...

回答 3 投票 0

CUDA 将共享内存用于 Hadamard 产品

我试图了解我是否正确使用和理解具有一维输入和矩阵输入的简单内核的共享内存。我正在做哈达玛产品,因为一维我...

回答 1 投票 0

有没有办法访问CUDA中常量存储体的值

我一直在尝试调试使用内联PTX汇编的cuda程序。具体来说,我正在指令级别进行调试,并尝试确定指令的参数值。

回答 2 投票 0

GPU 上稀疏线性系统的解决方案,来自 nvidia 的论文

我正在阅读一篇关于在 GPU 上求解线性系统(稀疏)的 Nvidia 文章。我陷入了 chainPtrHost 数据结构的构建上。我明白它的作用,但我不明白......

回答 1 投票 0

在CUDA工具包中包含的Thrust库中找不到thrust/universal_vector.h

我目前正在使用 Thrust 在 GPU 和 CPU 之间传输数据。但是当我在代码中包含 并使用 CMake 配置项目时,“致命错误:没有这样的...

回答 1 投票 0

即使设置了 CUDA_HOME 也会出现 CUDA_HOME 错误

我最近尝试运行nvidia labs开发的neuralangelo程序,在设置conda环境时遇到错误: 收集git+https://github.com/NVlabs/tiny-cuda-nn/#

回答 1 投票 0

如何为 CMAKE_<LANG>_HOST_COMPILER 指定标志?

CMake 有一组名为 CMAKE__FLAGS(CMAKE_CXX_FLAGS、CMAKE_Fortran_FLAGS 等)的变量,在构建命令行以使用编译器编译目标时使用这些变量

回答 1 投票 0

PyTorch 和 TensorFlow 中的 GPU ID 命名法

docker 如何为容器分配 GPU? 当我在具有 3 个 GPU 的计算机上运行 3 个 docker 容器时,GPU ID 会改变吗?

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.