[![在这里输入的形象描述] [1] [1]可能是什么原因F1得分,这不是精确调和平均值,并与宏平均召回多类权重相等?我的数据集不平衡,并预测歪斜。
一个macro F1指标计算每个标签,发现其未加权平均值。意味着它没有考虑类不平衡考虑而,一个weighted macro F1计算度量为每个标签,并发现它们的平均通过每个标签的实例的数目进行加权。因此,它占了类失衡,可以具有不准确率和查之间的分数。
对于加权F1的一个例子,请参考本答案Sandeep。