我正在尝试调试 Nan 训练问题,并考虑使用 Tensorboard Debugger V2 来执行此操作。我在训练代码顶部用这一行实现了它:
tf.debugging.experimental.enable_dump_debug_info(OUTPUT_FOLDER + 'tensorboard' +
"/debug/tfdbg2_logdir",
tensor_debug_mode="FULL_HEALTH",
circular_buffer_size=-1)
我遇到这个问题时的问题是我的日志文件是0 KB;检查以确保您的日志确实有效。当我找到完整的解决方案时,我会更新此评论,但尽管除了创建初始文件之外,我还无法实际使用 debugV2 转储数据。