NVRTC有没有可能编译成功,但是没有生成PTX?

问题描述 投票:0回答:0

过去,NVRTC 编译 CUDA 代码的结果——至少,你能得到的结果——总是一个 PTX。但是 - 从 CUDA 11.1 开始,我们可以获得 CUBIN 对象作为编译结果。

现在,如果我用

--gpu-architecture=compute_XY
编译一些 XY,我只会得到一个 PTX 而没有 cubin;如果我用
--gpu-architecture=sm_XY
编译,我会得到 PTX 和 CUBIN。但也许我的经历并不详尽,所以:

是否有可能成功进行 NVRTC 编译 - 对于编译选项的某种组合和某些版本的 CUDA - 仅生成非 PTX 输出(CUBIN 或其他),并且没有 PTX 可用?

compilation cuda ptx nvrtc
© www.soinside.com 2019 - 2024. All rights reserved.