cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

核心内的 CUDA 并行性

在CUDA中,它是如何管理GPU核心内部的顺序代码的? 如果我在 for 循环中有一个内核,它以顺序模式管理还是存在逻辑并行?

回答 2 投票 0

CUDA 10 不支持 7 之后的 Gcc 版本 - Arch Linux 中的 Qt 错误

我正在运行 Arch Linux 并尝试在 Qt 中构建一个项目,但是,Qt 出现以下错误: /opt/cuda/include/crt/host_config.h:129: 错误: #error -- 不支持的 GNU 版本!海合会版本

回答 2 投票 0

如何将 Cutlass 包含在 CuPy 项目中?

内核 = r""" #包括 外部“C”__global__无效entry0(){ 返回 ; } ”“” 导入 cupy 作为 cp raw_module = cp.RawModul...

回答 1 投票 0

CUDA_VERSION 和 CUDART_VERSION 一定相同吗?

CUDA 驱动程序 API 定义 CUDA_VERSION(在 cuda.h 中),CUDA 运行时 API 定义 CUDART_VERSION(在 cuda_runtime_api.h 中)。然而 - CUDART_VERSION 没有定义为 CUDA_VERSION 而是直接...

回答 1 投票 0

哪些版本的 Pytorch、Tensorflow、MMCV-Full 和 CUDA 可在 conda 环境中工作?

哪些版本的 Pytorch、Tensorflow、MMCV-Full 和 CUDA 可在 conda 环境中工作?

回答 1 投票 0

如何设置cuFFT超时?

我正在寻找一种方法来中断 cuda FFT 计算(如果它运行时间太长)。如何才能实现呢? 我在 API 中寻找一些超时设置,但没有找到这样的选项。当好...

回答 1 投票 0

CMake 错误:CMAKE_CUDA_ARCHITECTURES 如果设置则必须为非空

我正在使用 CMake 3.26 来配置使用 CUDA 的项目。其CMakeLists.txt是: cmake_minimum_required(版本3.25) 项目(foo CUDA) 我通过调用将其定向到特定的 CUDA 版本 c...

回答 1 投票 0

内核从不同的翻译单元访问 __constant__ 变量

我有三个文件: 主程序 #包括 #包括 #include“kernels.cuh” __constant__ 浮动设备ConstVar; 无效setConstantValue(浮点值){

回答 1 投票 0

CUDA 矩阵乘法中的分段错误(核心转储)

我正在开发用于矩阵乘法的 CUDA 程序,并且遇到“分段错误(核心转储)”错误。我已经包含了下面代码的相关部分。错误发生...

回答 1 投票 0

如何为这个函数编写cuda内核?

我有一个 C 内核,我想将其转换为 cuda 内核。然而,我在为这个函数编写内核时遇到了麻烦,因为它由多个嵌套循环组成。我的方法是

回答 1 投票 0

为什么CUDA无法与easyocr一起使用?

根据Pytorch我在cmd中使用了这个命令 pip3 安装 torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113 但CUDA仍然不可用。有人可以帮助我吗,

回答 3 投票 0

PyCUDA 和 NumbaPro CUDA Python 有什么区别?

我是 CUDA 新手,正在尝试弄清楚 PyCUDA(免费)还是 NumbaPro CUDA Python(非免费)对我来说更好(假设库成本不是问题)。 两者似乎都要求您...

回答 2 投票 0

找不到 CUDA 10.0 的 Pytorch 1.7 兼容版本

我正在重现一个需要pytorch 1.7和CUDA 10.0的项目。 但是,我发现(https://pytorch.org/get-started/previous-versions/)CUDA 10 没有 pytorch 1.7 版本保留...

回答 1 投票 0

CMake:通过 NVCC 传递编译器标志列表

我正在尝试编译一些 CUDA,并且希望显示编译器警告。相当于: g++ Fish.cpp -Wall -Wextra 除了 NVCC 不理解这些,你必须通过它们: NVCC...

回答 2 投票 0

除了 CUDA 之外,C++ 中是否允许使用三重尖括号 `<<<` and `>>>`?

nvcc 可以识别此语法,以在 CUDA 内核调用中分配线程和块的数量,但是在 CUDA 之外是否有任何上下文可以使其成为合法的 C++? (任何 C++ 版本,包括草稿...

回答 1 投票 0

PyTorch cuda 内存不足问题

在 PyTorch 中训练模型时,我不断收到以下错误。我什至在代码开头添加了以下内容,但我不断收到此消息。我通过 Jupyter Notebook 运行它。

回答 1 投票 0

为什么 torch.version.cuda 和 deviceQuery 报告不同的版本?

我对我的系统上安装的 CUDA 版本以及我的软件能否有效使用有疑问。 我在网上做了一些研究,但找不到解决我的疑问的方法。 这个问题...

回答 3 投票 0

无法在 GPU 上应用大津阈值,opencv 会抛出以下错误:errorthreshold.cu:105: error: (-215:Assertion failed) type <= 4 in function 'threshold'

我正在尝试在 GPU 中完成所有图像处理而不是 CPU 处理: #编码=utf8 导入CV2 # 阅读 GPU 上的图像 图像 = cv2.cuda_GpuMat() image.upload(cv2.imread("sutil.jpeg&q...

回答 1 投票 0

具有多(CPU)线程的多GPU编程

我有一个令人尴尬的并行应用程序。是否可以启动多个CPU线程,以便一个线程管理一个GPU?如果可以,我应该在CPU端使用什么线程库?

回答 2 投票 0

为什么 CUDA 内核会因 CPU 代码而变慢?

我使用 CUDA 编写了一个屏蔽模板匹配算法。正如我所测试的,该算法的功能是正确的。然而,当我尝试比较该算法的 CUDA 实现时...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.