我应该从训练集中标记多少张图像?

问题描述 投票:0回答:1

我们有 10,000 张图像,我们想要实现一个深度学习模型来提取植被。如果我们想要 80% 的训练集,我们应该标记的最少图像数量是多少?

我们想要使用语义分割,我们应该标记每个对象还是仅标记植被?

deep-learning dataset training-data semantic-segmentation
1个回答
0
投票

嗯,你需要标注的数据量与训练数据的百分比无关,如果你要以监督方式完全训练,那么你需要标注你拥有的 100% 的数据。

一种可能有帮助的有用方法是使用机器生成的注释并限制人力来纠正机器错误和修改数据,从而节省大量昂贵的人力。

如果注释资源有限,该领域的传统观点建议从可能来自不同领域(不同数据)或类似任务的强大模型开始,从而显着减少对域内数据的需求,而不会损失性能。

您只需要注释您感兴趣的对象,您会做任何不同的事情的唯一原因是,如果您想稍后在不同的域或不同的任务中重新调整数据的用途,那么预先添加额外的类可能会更便宜。

© www.soinside.com 2019 - 2024. All rights reserved.