如何使用 Nsight Compute 分析寄存器溢出?

问题描述 投票:0回答:1

我无法找到本地内存使用数据的位置。现在,我只知道在源代码中寻找STL指令。我希望我能找到具体的数字。

cuda nsight-compute
1个回答
0
投票

非常简短的答案显然是 NSight Compute 目前不显示本地内存溢出。

但是:

  • 如果您使用 nvcc 进行静态编译,您始终可以通过
    -Xptxas=“-v”
    看到链接器溢出到本地内存,即打开汇编器的详细输出。
  • 如果您使用 nvrtc 并在运行时编译,如果您有该函数的句柄,则可以通过具有
    cuFuncGetAttribute
    属性的
    CU_FUNC_ATTRIBUTE_LOCAL_SIZE_BYTES
    API 以编程方式获取信息
  • 如果您使用 Cupy,内核对象具有
    local_size_bytes
    属性,会在编译后自动填充。

[根据评论汇总的答案并添加为社区 wiki 条目]

© www.soinside.com 2019 - 2024. All rights reserved.