借条。如何计算物体检测算法的真阳性率，每个图像可以有多个物体？

Question

如何计算物体检测算法的误报率，每个图像可以有多个物体？

在我的数据中，给定图像可能有许多对象。如果它的IOU带有一个真值盒高于某个阈值，我计算一个预测的盒子为真正的阳性，否则为假阳性。例如：我有2个预测边界框和2个地面真实边界框：

我为每对预测和地面真实边界框计算了IoU：IoU = 0.00, 0.60, 0.10, 0.05 threshold = 0.50

在这种情况下，我是否有例子？你能解释一下吗？

Answer 1

总结，具体：是的，你有TP;你还有一个FP和一个FN。

总结，详细：您的预测模型正确识别了一个GT（地面实况）框。它错过了另一个。它错误地识别出第三个框。

分类逻辑：

至少，您的IoU数字应该是矩阵，而不是线性序列。对于M预测和N GT盒子，你将有一个NxM矩阵。你看起来像这样：

0.00 0.60
0.10 0.05

现在，找到矩阵中的最大值0.60。这高于阈值，因此您声明匹配并从矩阵中消除该预测和该GT框。这给你留下了一个相当无聊的矩阵：

0.10

由于此值低于阈值，因此您将无法匹配。你有一个预测，剩下一个GT。使用一个“命中”，您的分类集中有三个对象：两个预期对象，第三个由预测器创建。您可以像这样对gt和pred列表进行编码：

gt   = [1, 1, 0]    // The first two objects are valid; the third is a phantom.
pred = [1, 0, 1]    // Identified one actual box and the phantom.

那清楚了吗？