如何计算物体检测算法的误报率,每个图像可以有多个物体?
在我的数据中,给定图像可能有许多对象。如果它的IOU带有一个真值盒高于某个阈值,我计算一个预测的盒子为真正的阳性,否则为假阳性。例如:我有2个预测边界框和2个地面真实边界框:
我为每对预测和地面真实边界框计算了IoU:IoU = 0.00, 0.60, 0.10, 0.05
threshold = 0.50
在这种情况下,我是否有例子?你能解释一下吗?
总结,具体:是的,你有TP;你还有一个FP和一个FN。
总结,详细:您的预测模型正确识别了一个GT(地面实况)框。它错过了另一个。它错误地识别出第三个框。
分类逻辑:
至少,您的IoU数字应该是矩阵,而不是线性序列。对于M
预测和N
GT盒子,你将有一个N
xM
矩阵。你看起来像这样:
0.00 0.60
0.10 0.05
现在,找到矩阵中的最大值0.60。这高于阈值,因此您声明匹配并从矩阵中消除该预测和该GT框。这给你留下了一个相当无聊的矩阵:
0.10
由于此值低于阈值,因此您将无法匹配。你有一个预测,剩下一个GT。使用一个“命中”,您的分类集中有三个对象:两个预期对象,第三个由预测器创建。您可以像这样对gt和pred列表进行编码:
gt = [1, 1, 0] // The first two objects are valid; the third is a phantom.
pred = [1, 0, 1] // Identified one actual box and the phantom.
那清楚了吗?