cuda 11 内核无法运行

问题描述 投票:0回答:1

这是一个

demo.cu
,旨在从 GPU 设备打印:

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>

__global__ void hello_cuda() {
        printf("hello from GPU\n");
}

int main() {
        printf("hello from CPU\n");
        hello_cuda <<<1, 1>>> ();
        cudaDeviceSynchronize();

        cudaDeviceReset();
        printf("bye bye from CPU\n");
        return 0;
}

它编译并运行:

$ nvcc demo.cu
$ ./a.out

这就是我得到的输出:

hello from CPU
bye bye from CPU

问:为什么GPU没有打印结果?

看起来我确实错误配置了 cuda 工具包或其他东西,但是我可以从 cuda-samples 编译并运行各种程序。例如,matrixMuldeviceQuery

cuda printf nvidia
1个回答
9
投票

如果您的设备的计算能力为 3.0 或更低,CUDA 11 会放弃对这些 GPU 的支持。您需要使用之前的 CUDA 版本

CUDA 编译器必须针对 GPU 目标(即设备架构)进行编译。如果您没有在编译命令行上指定目标架构,从历史上看,CUDA 会选择一个非常灵活的默认架构规范,可以在 CUDA 版本支持的所有 GPU 上运行。

情况并非总是如此,CUDA 11 也并非如此。CUDA 11(和 CUDA 12)针对默认架构

sm_52
进行编译(计算能力 5.2,即,就像您指定了
命令行上的 -arch=sm_52
)。但 CUDA 11 支持低至
sm_35
的架构(计算能力 3.5)。 (CUDA 12 已放弃对 sm_3x GPU 的支持。)

因此,如果您没有在 CUDA 11 的编译命令行上指定目标架构,并尝试在具有

sm_52
之前的架构的 GPU 上运行,您编写的任何 CUDA 代码(内核)肯定不会运行工作。

这是一个很好的实践,任何时候您在使用 CUDA 代码时遇到问题,都可以使用正确的 CUDA 错误检查,如果您在这里这样做了,您将收到一个运行时错误指示,该指示将立即识别问题(至少对于熟悉 CUDA 错误的人来说)。

这些情况下的解决方案是指定一个编译命令,其中包括您打算运行的 GPU(无论如何,这通常是一个很好的做法)。如果您这样做,并且您指定的架构已“弃用”,那么

nvcc
编译器将发出警告,让您知道未来的 CUDA 版本可能不支持您尝试运行的 GPU。该警告并不意味着您所做的任何事情是错误或非法的或需要更改,而是意味着将来的 CUDA 版本可能不支持该 GPU。

如果您想抑制该警告,可以在编译命令行上传递

-Wno-deprecated-gpu-targets
开关。

当然,同样的问题也可能发生在 Windows 上。在这种情况下,您需要修改以下 VS 项目设置以匹配您的设备的架构:

© www.soinside.com 2019 - 2024. All rights reserved.