深度学习Nan损失原因

Question

也许太笼统了，但是谁能解释导致卷积神经网络发散的原因？

具体：

我正在将Tensorflow的iris_training模型与我自己的一些数据一起使用，并不断获取

错误：tensorflow：模型因损失= NaN而发散。
追踪...
tensorflow.contrib.learn.python.learn.monitors.NanLossDuringTrainingError：训练期间NaN丢失。

追溯源自行：

 tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
                                        hidden_units=[300, 300, 300],
                                        #optimizer=tf.train.ProximalAdagradOptimizer(learning_rate=0.001, l1_regularization_strength=0.00001),                                                          
                                        n_classes=11,
                                        model_dir="/tmp/iris_model")

我尝试过调整优化器，将学习率设置为零，并且不使用优化器。任何对网络层，数据大小等的见解都值得赞赏。

Answer 1

如果您正在训练交叉熵，则希望在输出概率中添加一个小数，例如1e-8。

Answer 2

如果使用整数作为目标，请确保它们不对称于0。

Answer 3

就我而言，设置远距离整数标签时得到NAN。即：

Answer 4

如果您想收集有关该错误的更多信息，并且如果该错误是在前几次迭代中发生的，则建议您在仅CPU模式（无GPU）下运行实验。该错误信息将更加具体。

Answer 5

正规化可以提供帮助。对于分类器，无论是二进制分类器还是多分类器，都有很好的活动正则化条件。对于回归器，内核正则化可能更合适。

深度学习Nan损失原因

问题描述投票：46回答：6

6个回答

最新问题

深度学习Nan损失原因

问题描述 投票：46回答：6

6个回答

最新问题

问题描述投票：46回答：6