我想使用dlprof命令行实用程序。根据文档:https://docs.nvidia.com/deeplearning/frameworks/dlprof-user-guide/
我安装了nvidia tensorflow泊坞窗,我可以运行它docker run --gpus all -it --rm -v local_dir:/ root nvcr.io/nvidia/tensorflow:20.03-tf2-py3
但是我既无法执行dlprof也无法找到它。您现在如何执行它?谢谢
已在NVIDIA容器中预装了dlprof,并且可以通过命令行调用,如quickstart中所述。它还向您展示了一种在张量板上查看结果的简便方法。
为了开始,您可以通过简单地使用运行dlprof
dlprof [选项] [您的命令]
例如:
dlprof --reports = summary python main.py
您的代码将在被dlprof进行配置时执行。结果将放入当前目录的dlprof_summary.csv中。有多种报告可用,例如:摘要,详细,内核,张量等。
[您可以在report generation找到更多