可能是什么原因F1得分，这不是的精确度和召回调和平均值

[！[在这里输入的形象描述] [1] [1]可能是什么原因F1得分，这不是精确调和平均值，并与宏平均召回多类权重相等？我的数据集不平衡，并预测歪斜。

2
投票

一个macro F1指标计算每个标签，发现其未加权平均值。意味着它没有考虑类不平衡考虑而，一个weighted macro F1计算度量为每个标签，并发现它们的平均通过每个标签的实例的数目进行加权。因此，它占了类失衡，可以具有不准确率和查之间的分数。

对于加权F1的一个例子，请参考本答案Sandeep。