我有一个使用estimator api构建的二元分类器模型。该型号有大约300个功能和一个标签。我正在使用一个具有175个神经元的隐藏层模型。
我用5000个训练步骤运行模型。在分成训练,测试和验证集之前,我有一个类的278个实例和第二个类的178个实例。它不完美平衡。
话虽如此,我的准确率为0.984。
所以,我试图解释直方图的结果,看看我是否可以用它来确定哪些特征比其他特征更重要。以下是直方图选项卡中的一些图片。
这是logits的屏幕截图。
根据这些屏幕截图,看起来这些直方图是针对隐藏图层和日志的激活值。我不相信这会给你任何关于你的特征如何影响模型输出的指示,因为这些直方图只是计算那些图形操作的输出值的分布。
总的来说,我认为Tensorboard更适合监控而不是分析,因为Tensorboard的主要目标是make it easier to understand, debug, and optimize TensorFlow programs。
话虽这么说,Tensorflow团队构建了一个名为Tensorflow Model Analysis(TFMA)的工具,它看起来非常适合你想要做的事情:
如果您已经使用了估算器API,那么您应该能够调整代码以使用TFMA而无需进行大量更改。 getting started guide可能是一个很好的起点!