如何使用Tensorboard确定重要功能？

Question

我有一个使用estimator api构建的二元分类器模型。该型号有大约300个功能和一个标签。我正在使用一个具有175个神经元的隐藏层模型。

我用5000个训练步骤运行模型。在分成训练，测试和验证集之前，我有一个类的278个实例和第二个类的178个实例。它不完美平衡。

话虽如此，我的准确率为0.984。

所以，我试图解释直方图的结果，看看我是否可以用它来确定哪些特征比其他特征更重要。以下是直方图选项卡中的一些图片。

这是logits的屏幕截图。

Answer 1

根据这些屏幕截图，看起来这些直方图是针对隐藏图层和日志的激活值。我不相信这会给你任何关于你的特征如何影响模型输出的指示，因为这些直方图只是计算那些图形操作的输出值的分布。

总的来说，我认为Tensorboard更适合监控而不是分析，因为Tensorboard的主要目标是make it easier to understand, debug, and optimize TensorFlow programs。

话虽这么说，Tensorflow团队构建了一个名为Tensorflow Model Analysis（TFMA）的工具，它看起来非常适合你想要做的事情：

如果您已经使用了估算器API，那么您应该能够调整代码以使用TFMA而无需进行大量更改。 getting started guide可能是一个很好的起点！