YOLO 中调整大小对模型精度有何影响?

问题描述 投票:0回答:1

我使用YOLOv8X进行照片中的物体检测,最近我一直想知道图像大小对检测质量的影响。我通常使用 Roboflow 中的数据集,并将大小调整为 1280x1280(这比标准大小调整为 640x640 的性能明显更好),但原始照片的纵横比通常远离正方形,调整大小会改变照片中对象的比例。数据集中的注释会根据新的照片尺寸重新计算,但更改比例会降低检测质量吗?我可以在不调整输入照片大小的情况下训练模型吗?如果我可以在训练期间简单地指定参数 imgsz=1280 ,是否有必要在 Roboflow 上调整大小?

我在 Roboflow 上应用和不应用调整大小的情况下训练了模型,质量指标相似。数据集中的一些照片在大小调整到 1280x1280 后显得不自然地拉伸,这可能会由于形状的变化而降低模型识别对象的能力。

machine-learning computer-vision image-resizing detection yolo
1个回答
0
投票

您应该观看解释正确使用尺寸的视频。最佳大小是您要查找的最小对象的大小将被调整为您正在使用的网络可以轻松找到它的方式。您可以在这里找到:https://youtu.be/m3Trxxt9RzE

YOLO FAQ 中也有关于此主题的条目:https://www.ccoderun.ca/programming/yolo_faq/#optimal_network_size

为什么要将自己限制为 640x640 或 1280x1280?图像和视频帧很少是正方形的。您应该调整网络大小,使宽高比与您的图像或视频帧相匹配:https://www.ccoderun.ca/programming/yolo_faq/#square_network

如果您要寻找的物体具有特定的“形状”,这一点就变得更加重要。例如区分椭圆形和圆形,或正方形和长方形。

© www.soinside.com 2019 - 2024. All rights reserved.