评价多标签对象检测模型的平均精度指标。

问题描述投票：0回答：1

我的目标是评估模型在测试数据集上的性能，以实现以下目标 对象检测任务. 使用Tensorflow对象检测API对6个类的数据集进行模型训练。对于一些类有20个对象样本，而对于一些类可能只有一个样本。所以，训练集和测试集的数据都是不平衡的。我可以使用平均精度（mAP）作为评估指标吗？在我看来，对于不平衡的数据使用它是不正确的。因此，我不知道该使用哪些其他指标。那么什么样的指标适合这种情况呢？

我将感谢任何关于这方面的帮助。