如何在高分辨率图像上进行物体检测？

Question

我有大约

2000 X 2000

像素的图像。我试图识别的对象尺寸较小（通常在

100 X 100

像素左右），但数量很多。

我不想调整输入图像的大小、应用对象检测并将输出重新缩放回原始大小。原因是我要处理的图像很少，而且我更喜欢裁剪（这会导致每个图像有多个训练实例），而不是调整到更小的尺寸（这会给我每个原始图像 1 个输入图像）。

是否有一种复杂的方法来裁剪和重新组合图像以进行对象检测，特别是在对测试图像进行推理时？

对于训练，我想我会取出随机作物，并使用它们进行训练。但为了测试，我想知道是否有一种特定的方法来裁剪测试图像，应用对象检测并将结果组合回来以获得原始大图像的输出。

Answer 1

我想同时使用多个（我从未尝试过）网络是一种选择，对你来说，使用 4*4 (500+50 * 500+50) 相对于每个 1*1)，然后在输出阶段重新组装，（可能是 NMS 在边界，因为你提到目标很密集）。

但这很奇怪。

您知道高分辨率图像检测的一个见解是使用“U”形快捷方式改变主干，这可以在不调整图像大小的情况下解决一些问题。参考U-Net。

Answer 2

这就是 SAHI 试图解决的问题：