我注意到,CUDAOpenCL通过编译器驱动程序(驱动程序版本。440.64)在第一次编译内核后快了10倍。因此,该驱动缓存了生成的二进制文件,而不是每次编译都从代码缓存中检索。
有什么方法可以...
根据Nvidia文档,这可以用JIT缓存选项来解决。CUDA专业技巧。了解胖二进制文件和JIT缓存
export CUDA_CACHE_DISABLE=1
~/.nv/ComputeCache