有没有办法获得有关如何在NVidia平台(或其他平台)上编译OpenCL内核的详细信息。可以放入内核的外部工具或测试。特别:
可以在PTX装配输出中看到此信息,还是更高级别?
这是所有编译器级元数据;其中一些可通过通用OpenCL API获得,但您请求的太低级别。可能通过一些Nvidia OpenCL扩展可用,我不熟悉那些。可能你最好的选择是找到一些工具在PTX级别工作并将其提供给OpenCL程序二进制文件。