在计算能力<= 7.2的设备上,我总是使用
nvprof --events shared_st_bank_conflict
但是当我使用CUDA10在RTX2080ti上运行它时,它会返回
Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2
那么如何才能检测到这些设备上是否存在共享内存库冲突?
我安装了Nvidia Nsight Systems和Nsight Compute,找不到这样的分析报告......
THKS
这似乎是一个问题,并在this帖子中解决了NVIDIA论坛。显然应该使用Nsight工具之一(CLI或UI)来支持它。