如何修改ptx文件并将其链接到可执行文件?
顺便说一句,我知道如何从.ptx
生成.cu
文件以及如何从.ptx.
生成.cubin,但我不知道如何获取最终的可执行文件。
更具体地说,我有一个sample.cu
文件,该文件被编译为sample.ptx
。然后,我使用nvcc将sample.ptx
编译为sample.cubin
。但是,如果没有主机代码,则无法直接执行此.cubin
文件。如何将.cubin
文件链接到原始.cu
文件以生成最终的可执行文件?
您应该能够使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页上有一个示例here
从CUDA 4.0开始,您可以在CUDA内核中编写嵌入式PTX。