我无法找到本地内存使用数据的位置。现在,我只知道在源代码中寻找STL指令。我希望我能找到具体的数字。
非常简短的答案显然是 NSight Compute 目前不显示本地内存溢出。
但是:
-Xptxas=“-v”
看到链接器溢出到本地内存,即打开汇编器的详细输出。cuFuncGetAttribute
属性的 CU_FUNC_ATTRIBUTE_LOCAL_SIZE_BYTES
API 以编程方式获取信息local_size_bytes
属性,会在编译后自动填充。[根据评论汇总的答案并添加为社区 wiki 条目]