cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

获取 nvcc 正确报告的 CUDA 版本

我正在尝试在 Ubuntu 中更新 CUDA。按照此处的指南,我的初始设置将 CUDA 版本报告为: via nvcc - Cuda 编译工具,版本 10.1,V10.1.243 通过 nvidia-smi - 11.1

回答 1 投票 0

OpenAI Whisper 允许我在命令行上使用 cpu 设备,但在解释器中强制使用 cuda 并失败

我可以成功使用whisper cli来转录音频wav文件。我使用命令: 耳语--语言 en --模型微小--设备 cpu .tmp/audio/chunk1.wav 位于此处,并使用 python 3.11...

回答 1 投票 0

如何正确地将复数从向量向量复制到 GPU 设备内存并使用 CUDA 执行 FFT?

我正在开发一个 C++ Windows 项目,该项目涉及使用 CUDA 10.1 库在设备上进行 FFT 计算。 我有一个向量 std::vector>>

回答 1 投票 0

OpenCV - 将 GpuMat 复制到 cuda 设备数据中

我正在尝试将 cv::cuda::GpuMat 中的数据复制到要在内核中使用的 uint8_t* 变量。 GpuMat 包含分辨率为 752x480 且类型为 CV_8UC1 的图像数据。下面是

回答 1 投票 0

如何在 Python 中将函数指针传递给 cuPy Raw 内核?

我正在使用 cuPy 在 Python 脚本中调用原始 CUDA 内核。我能够在 Python 脚本中加载简单的独立 CUDA 内核,但如果我的 CUDA 内核需要

回答 1 投票 0

cuPy 的内存泄漏(Python 中的 CUDA)

我在 python 脚本中使用原始 CUDA 内核。在下面的 MWE 中,我有一个超级简单的原始内核,它没有做任何事情。在下面的代码中,我只是创建一个大数组(大约 2 GB)并且

回答 1 投票 0

目标“cmTC_28d80”的 CUDA_ARCHITECTURES 为空

我在 CLion 中创建了一个新的 CUDA 可执行项目,当它打开时,出现 CMake 错误: 对于目标“cmTC_908f4”,CUDA_ARCHITECTURES 为空。 CMakeLists.txt: cmake_minimum_required(版本 3....

回答 5 投票 0

GeForce GTX 1650 加速无需安装 CUDA 工具包?

有没有办法在Windows电脑上不安装CUDA Toolkit的情况下使用GPU加速? 首先,我有一个pytorch模型,需要部署在windows电脑上。无需安装...

回答 1 投票 0

“code=sm_X”是否仅嵌入二进制(cubin)代码,或者也嵌入 PTX 代码,或者两者都嵌入?

我对“-gencode”语句中的“code=sm_X”选项有点困惑。 示例:NVCC 编译器选项的作用是什么 -gencode arch=compute_13,code=sm_13 嵌入图书馆? ...

回答 2 投票 0

什么是银行冲突? (进行Cuda/OpenCL编程)

我一直在阅读CUDA和OpenCL的编程指南,但我不明白什么是银行冲突。他们只是深入研究如何解决问题,而不详细说明主题

回答 5 投票 0

无法加载动态库“libcublasLt.so.11”; dlerror:libcublasLt.so.11:无法打开共享对象文件:没有这样的文件或目录

我刚刚更新了我的显卡驱动器 sudo apt install nvidia-driver-470 sudo apt install cuda-drivers-470 我决定以这种方式安装它们,因为它们在 tr 时被阻止......

回答 2 投票 0

循环旋转GPU矢量?

我有一个想要实现的算法,其中涉及 坐标加法, 坐标乘法,以及 坐标的循环旋转。 我的加法和乘法有点

回答 1 投票 0

在 numba cuda 中删除数组的零值

我有一个很长的数组 arr = np.array([1,1,2,2,3,3,0,0,2,2]) 我想在 numba cuda 中删除该数组的所有零值,因为实际数组非常大并且 numpy 非常慢。 有人吗

回答 2 投票 0

cibuildwheel 和 CUDA

我正在尝试编译一个需要 CUDA 的二进制(C++)Python 包。除了查找 CUDA 工具包(CMake 找不到 nvcc)之外,一切正常。 我已将范围缩小到 Docker 容器我...

回答 1 投票 0

在 opencv c++(有 cuda)和 cuda-C 中测量时间

我已经编写了一个在 CUDA-C 中添加 2 个图像的函数,现在我想测量 CUDA-C 的时间并仅使用 OpenCV C++(带有 CUDA 的库)。使用是否正确: cudaEvent_t开始、停止;

回答 1 投票 0

CUDA 中的固定大小 SVD 和求解器(在设备中)

我在GPU(CUDA)上实现了一个程序,它仅使用主机(C++)来启动新内核。在设备上计算期间,我需要 SVD 和 3x3(稠密)矩阵求解系统,固定...

回答 3 投票 0

如何通过端到端连接文字字符串 S 的 N 个实例来编译时构造文字字符串?

我正在开发一个cuda程序。有一个大整数类型LargeInteger,它表示由N个类型E的实例构造的大整数。例如,LargeI...

回答 1 投票 0

nvprof 带宽选项

从命令行使用 nvprof --metrics 测量带宽的正确选项是什么?我正在使用 flop_dp_efficiency 来获取峰值 FLOPS 的百分比,但似乎有很多选择...

回答 1 投票 0

在不下载CUDA的情况下安装支持GPU的torch?

PyTorch 似乎与其自己的 CUDA 库捆绑在一起。但是,如果我们已经有了它们(可能是更新的)并且只想安装火炬怎么办? 还有额外的问题:为什么 PyTorch 无法检测或接受......

回答 1 投票 0

如何在ubuntu上降级CUDA工具包?

目前我的 ubuntu 22.04 上有 cuda 12.2。为了使用 paddlepaddle-gpu,我需要使用 CUDA 10.2 来适应我想要使用的模块的命令。 由于我很难找到明确的参考资料,我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.