我使用TensorFlow固定估计器从有利于最高分的情况(没有“好”或“坏”的答案,但根据情况要比另一个更好的答案)预测游戏动作。每种情况/动作样本的得分都代表了这一现实。得分包含在train_data中,用作权重,并在估算器中作为权重列传递。
1)我尝试了没有重量列的情况:该模型适合70%且有良好答案。该模型适用于主要示例,但不适用于边缘示例(剩余约20%...)]
2)我尝试了weight = exp(-score)。模型适合约45%,可以更好地处理边际示例,但与主要示例的准确性非常差。
[我认为我的体重秤[0.0001-5003.98]存在问题,最好的结果为0.0001,价值为5003.98。正则化的好方法是什么?
我读了公式weight =(score-mean(score))/ std(score)可以解决,但似乎不起作用
model = tf.estimator.LinearClassifier(feature_columns=feature_columns,
optimizer=tf.train.AdamOptimizer(learning_rate=0.001, beta1= 0.9,beta2=0.99, epsilon = 1e-08,use_locking=False),
weight_column=weights,
n_classes=10,
label_vocabulary=Action_vocab,
model_dir='./Models/ActionPlayerModel20/',
loss_reduction=tf.losses.Reduction.SUM_OVER_BATCH_SIZE,
config=tf.estimator.RunConfig().replace(save_summary_steps=10))
weight = exp(-score)
我使用TensorFlow固定估计器从有利于最高分的情况(没有“好”或“坏”的答案,但根据情况要比另一个更好的答案)预测游戏动作。 ...
通过执行以下操作解决了重量问题(缩放):