获取有关NVidia上已编译的OpenCL内核的详细信息

问题描述 投票:0回答:1

有没有办法获得有关如何在NVidia平台(或其他平台)上编译OpenCL内核的详细信息。可以放入内核的外部工具或测试。特别:

  • 矢量化是否成功,工作项如何被分组为变形?
  • 如果工作组内的工作项进入不同的分支,编译器是否对其进行了优化,以便它们仍然并行执行?
  • 私有内存变量是否映射到多处理器中的寄存器,还是放入本地/全局内存? (某些体系结构每个工作组的私有内存多于本地内存)

可以在PTX装配输出中看到此信息,还是更高级别?

opencl gpu nvidia gpgpu ptx
1个回答
1
投票

这是所有编译器级元数据;其中一些可通过通用OpenCL API获得,但您请求的太低级别。可能通过一些Nvidia OpenCL扩展可用,我不熟悉那些。可能你最好的选择是找到一些工具在PTX级别工作并将其提供给OpenCL程序二进制文件。

© www.soinside.com 2019 - 2024. All rights reserved.