nv-nsight-cu-cli导致Tensorflow失败

问题描述 投票:0回答:2

我已经下载了最新的Nsight Compute分析工具,我想用它来测试Tensorflow应用程序。我正在使用的代码是here。当我执行它时运行完全正常,当我用nvprof ./mnist.py对它进行基准测试时,它完全没有问题。但是,当我尝试使用命令sudo ./nv-nsight-cu-cli [path to the file]运行它时,我收到以下错误:

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

我怀疑nv-nsight-cu-cli在某种程度上根本没有认识到环境变量。周围有什么问题吗?

tensorflow gpu nvidia nsight nvprof
2个回答
1
投票

您需要在两种环境中搜索差异:

  • env变量
  • LD_LIBRARY_PATH
  • /etc/ld.so.conf
  • /etc/ld.so.conf.d/*
  • CUBLAS 安装完成/没有损坏? 它是否安装在两台机器上的相同位置? 版本
  • ...

您可以从两台机器上的locate libcublas.so开始,看看是否存在差异。或者,你可以strace -f -e open该程序,以检查它从哪里尝试libcublas.so

您的错误(目前)与GPU无关:libcublas.so.9.0可能无法找到。找到它,找到为什么Tensorflow无法找到它,你的问题将得到解决。


0
投票

此时此工具似乎不支持GP100。答案是here

Nsight Compute仅支持Pascal(GP100除外)和更高版本的GPU。

© www.soinside.com 2019 - 2024. All rights reserved.