我的目标是评估模型在测试数据集上的性能,以实现以下目标 对象检测任务. 使用Tensorflow对象检测API对6个类的数据集进行模型训练。对于一些类有20个对象样本,而对于一些类可能只有一个样本。所以,训练集和测试集的数据都是不平衡的。我可以使用平均精度(mAP)作为评估指标吗?在我看来,对于不平衡的数据使用它是不正确的。因此,我不知道该使用哪些其他指标。那么什么样的指标适合这种情况呢?
我将感谢任何关于这方面的帮助。
平均平均精度还是可以的。正如你所看到的,它是平均平均精度,所以,由于精度将被平均到所有的类上,它们的数量将不重要。