ResNet 需要什么类型的输入?

问题描述 投票:0回答:1

我是深度学习新手,我正在尝试训练 ResNet50 模型来对 3 种不同的手术工具进行分类。问题是,我读到的每一篇文章都告诉我,我需要使用 224 X 224 图像来训练 ResNet,但我拥有的图像大小为 512 X 288。

所以我的问题是:

  1. 是否可以使用512 X 288图像来训练ResNet而不裁剪图像?我不想裁剪图像,因为工具在图像内的位置相当随机,而且我认为裁剪图像也会剪掉部分工具。

  2. 对于训练集和测试集图像,我需要在要分类的对象周围画一个矩形吗?

  3. 如果一张图像中有多个不同的物体可以吗?我使用的数据集经常在一张图像中出现多个工具,我想知道我是否必须只使用一次只出现一个工具的图像。

  4. 如果我要裁剪图像以适合一种工具,即使图像大小不同也可以吗?

python deep-learning resnet image-classification
1个回答
2
投票

是否可以使用512 X 288图像来训练ResNet而不裁剪图像?我不想裁剪图像,因为工具在图像内的位置相当随机,而且我认为裁剪图像也会剪掉部分工具。

是的,您可以在不裁剪图像的情况下训练 ResNet。您可以调整它们的大小,或者如果由于某种原因无法做到这一点,您可以更改网络,例如在最后添加一个全局池并考虑不同的输入大小。 (您可能需要更改内核大小或下采样率)。

如果您最大的问题是 resnet 需要

224x224
,而您的图像大小为
512x228
,最简单的解决方案是首先将它们调整为
224x224
。仅当由于某些技术原因这对您来说不可能时,才可以通过在末尾添加全局池来创建完全卷积网络。 (我猜ResNet最后确实有GP,如果没有,你可以添加它。)

对于训练集和测试集图像,我需要在要分类的对象周围画一个矩形吗?

对于分类“否”,您不需要。仅当您想要进行检测时才需要对象的边界框(即当您希望模型也围绕感兴趣的对象绘制矩形时。)

如果一张图像中有多个不同的物体可以吗?我使用的数据集经常在一张图像中出现多个工具,我想知道我是否必须只使用一次只出现一个工具的图像。

一张图像中可以有多个不同的对象,只要它们不属于您正在训练的不同类别即可。也就是说,如果您尝试对苹果和橙子进行分类,很明显,图像不能同时包含它们。但如果它包含其他任何东西,螺丝刀、钥匙、人、黄瓜等,那就没问题。

如果我要裁剪图像以适合一种工具,即使图像大小不同也可以吗?

这取决于您的型号。裁剪和图像尺寸是两个不同的东西。您可以裁剪任何尺寸的图像,然后将其调整为您想要的尺寸。您通常希望所有图像具有相同的尺寸,因为这让您的生活更轻松,但这不是一个硬条件,根据您的要求,您也可以有不同的图像等。

© www.soinside.com 2019 - 2024. All rights reserved.