我有大约
2000 X 2000
像素的图像。我试图识别的对象尺寸较小(通常在 100 X 100
像素左右),但数量很多。
我不想调整输入图像的大小、应用对象检测并将输出重新缩放回原始大小。原因是我要处理的图像很少,而且我更喜欢裁剪(这会导致每个图像有多个训练实例),而不是调整到更小的尺寸(这会给我每个原始图像 1 个输入图像)。
是否有一种复杂的方法来裁剪和重新组合图像以进行对象检测,特别是在对测试图像进行推理时?
对于训练,我想我会取出随机作物,并使用它们进行训练。但为了测试,我想知道是否有一种特定的方法来裁剪测试图像,应用对象检测并将结果组合回来以获得原始大图像的输出。
我想同时使用多个(我从未尝试过)网络是一种选择,对你来说,使用 4*4 (500+50 * 500+50) 相对于每个 1*1),然后在输出阶段重新组装, (可能是 NMS 在边界,因为你提到目标很密集)。
但这很奇怪。
您知道高分辨率图像检测的一个见解是使用“U”形快捷方式改变主干,这可以在不调整图像大小的情况下解决一些问题。参考U-Net。
这就是 SAHI 试图解决的问题: