如何在高分辨率图像上进行物体检测?

问题描述 投票:0回答:2

我有大约

2000 X 2000
像素的图像。我试图识别的对象尺寸较小(通常在
100 X 100
像素左右),但数量很多。

我不想调整输入图像的大小、应用对象检测并将输出重新缩放回原始大小。原因是我要处理的图像很少,而且我更喜欢裁剪(这会导致每个图像有多个训练实例),而不是调整到更小的尺寸(这会给我每个原始图像 1 个输入图像)。

是否有一种复杂的方法来裁剪和重新组合图像以进行对象检测,特别是在对测试图像进行推理时?

对于训练,我想我会取出随机作物,并使用它们进行训练。但为了测试,我想知道是否有一种特定的方法来裁剪测试图像,应用对象检测并将结果组合回来以获得原始大图像的输出。

deep-learning object-detection yolo data-augmentation faster-rcnn
2个回答
0
投票

我想同时使用多个(我从未尝试过)网络是一种选择,对你来说,使用 4*4 (500+50 * 500+50) 相对于每个 1*1),然后在输出阶段重新组装, (可能是 NMS 在边界,因为你提到目标很密集)。

但这很奇怪。

您知道高分辨率图像检测的一个见解是使用“U”形快捷方式改变主干,这可以在不调整图像大小的情况下解决一些问题。参考U-Net。


0
投票

这就是 SAHI 试图解决的问题:

https://github.com/obss/sahi

© www.soinside.com 2019 - 2024. All rights reserved.