我找不到内置的张量流,允许你传入不总和为1的标签,所以试着写我自己的:(输入是[batch_size,labels])
tf.reduce_mean(tf.reduce_sum(y_true,axis=1) * tf.reduce_logsumexp(y_pred_logits,axis=1)
- tf.reduce_sum(y_true * y_pred_logits,axis=1))
然而它似乎没有起作用(损失是分歧的)。我做错什么了吗?
我认为这是正确的,但我将Adam优化器的“epsilon”设置得太低了。