Tensorboard 配置文件:未找到配置文件数据

问题描述 投票:0回答:1

问题

我在 Tensorboard 的配置文件部分没有看到任何内容。运行后得到如下Tensorboard界面

tensorboard --logdir logdir

logdir
的树如下:

logdir
├── events.out.tfevents.17026478. gpu.profile-empty
└── plugins
    └── profile
        ├── 2023_12_15_12_41_18
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        ├── 2023_12_15_12_41_21
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        ├── 2023_12_15_12_41_22
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        ├── 2023_12_15_12_41_23
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        ├── 2023_12_15_12_41_24
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        ├── 2023_12_15_12_41_25
        │   ├──  gpu.input_pipeline.pb
        │   ├──  gpu.kernel_stats.pb
        │   ├──  gpu.memory_profile.json.gz
        │   ├──  gpu.overview_page.pb
        │   ├──  gpu.tensorflow_stats.pb
        │   ├──  gpu.trace.json.gz
        │   └──  gpu.xplane.pb
        └── 2023_12_15_12_41_26
            ├──  gpu.input_pipeline.pb
            ├──  gpu.kernel_stats.pb
            ├──  gpu.memory_profile.json.gz
            ├──  gpu.overview_page.pb
            ├──  gpu.tensorflow_stats.pb
            ├──  gpu.trace.json.gz
            └──  gpu.xplane.pb

9 directories, 50 files

生成代码
logdir

这是一个简单的训练循环,使用

tf.profiler.experimental.Profile
API,灵感来自于 这个 TF 教程

for epoch in range(1, epochs+1):                                                   
    
    if dataset_exists is True:
        #with tf.profiler.experimental.Trace('train', step_num=epoch, _r=1):       
        with tf.profiler.experimental.Profile("logdir"):
            loss_train = model.training_step(dataset, optimizer)                   
    else:
        loss_train = training_step(model._model, X_train, Y_train, optimizer)    

附加信息

我在集群上运行代码以便使用 GPU。然后我使用 scp 将 logdir 文件夹从集群复制到我的个人笔记本电脑。

命令的输出

tensorboard --logdir logdir --inspect
:

======================================================================
Processing event files... (this can take a few minutes)
======================================================================

Found event files in:
logdir

These tags are in logdir:
audio -
histograms -
images -
scalars -
tensor -
======================================================================

Event statistics for logdir:
audio -
graph -
histograms -
images -
scalars -
sessionlog:checkpoint -
sessionlog:start -
sessionlog:stop -
tensor -
=====================================================================

如有必要,我可以在终端中添加警告。

版本

  • 张量板==2.8.0
  • 张量板数据服务器==0.6.1
  • tensorboard-plugin-profile==2.15.0
  • tensorboard-plugin-wit==1.8.1
  • 张量流==2.8.0
  • tensorflow-io-gcs-文件系统==0.34.0

问题/评论

  • 通过查看 Tensorboard 版本,用户应该使用相同版本的 Tensorflow 和 Tensorboard,因为“Tensorboard 版本 X 跟踪 Tensorflow 版本 X”
  • 对于那些设法将 Tensorboard 与 Tensorflow 结合使用的人,您使用了哪些版本的 Tensorflow 和 Tensorboard?
python tensorflow tensorflow2.0 tensorboard
1个回答
0
投票

实际上,您需要手动将

tensorboard-plugin-profile
的版本降级为
2.8.0

pip install tensorboard_plugin_profile==2.8.0

为了匹配

tensorflow
的版本。然后,您可能必须重新捕获张量板的分析数据。

© www.soinside.com 2019 - 2024. All rights reserved.