针对不平衡数据的归一化类权重

问题描述 投票:0回答:1

i具有一组用于在CNN神经网络上进行训练的不平衡数据。我想计算与每个标签的频率成正比的类别权重,这样,在计算反向传播条件时,频率较低的标签将得到增强,以使它们得到很好的表示。

到目前为止我做了什么:我有一个列表A,每个标签的出现频率。

A=[1009,2910,4014,152,605]

所以我做了以下-

class_weights_new=1/(A/np.min(A))

这产生了一系列权重,这些权重减少了与标签频率成正比的学习,从而减少了一个标签相对于其他标签的过度学习。

现在我对此事有两个问题-

  1. 我的逻辑有问题吗,我缺少什么吗?
  2. 到目前为止,此计算产生了较差的性能,我可能想平滑权重,以使权重仍然不平衡。我的意思是标签之间的比例将保持不变,但它们都趋向于接近1。什么数学运算会给我这样的结果?
  3. 谢谢!!!

i具有一组用于在CNN神经网络上进行训练的不平衡数据。我想计算将与每个标签的频率成正比的班级权重,以使不那么频繁的标签...

python machine-learning classification normalization
1个回答
0
投票

最常见的重量计算方法是,

© www.soinside.com 2019 - 2024. All rights reserved.