我已经下载了最新的Nsight Compute分析工具,我想用它来测试Tensorflow应用程序。我正在使用的代码是here。当我执行它时运行完全正常,当我用nvprof ./mnist.py
对它进行基准测试时,它完全没有问题。但是,当我尝试使用命令sudo ./nv-nsight-cu-cli [path to the file]
运行它时,我收到以下错误:
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
我怀疑nv-nsight-cu-cli
在某种程度上根本没有认识到环境变量。周围有什么问题吗?
您需要在两种环境中搜索差异:
LD_LIBRARY_PATH
/etc/ld.so.conf
/etc/ld.so.conf.d/*
您可以从两台机器上的locate libcublas.so
开始,看看是否存在差异。或者,你可以strace -f -e open
该程序,以检查它从哪里尝试libcublas.so
。
您的错误(目前)与GPU无关:libcublas.so.9.0
可能无法找到。找到它,找到为什么Tensorflow无法找到它,你的问题将得到解决。
此时此工具似乎不支持GP100。答案是here:
Nsight Compute仅支持Pascal(GP100除外)和更高版本的GPU。