为 CNN 注释图像有多大必要?如果可以的话,最快的方法是什么?

问题描述 投票:0回答:1

我有一个带有 keras 和 tensorflow 的 CNN,并且很好奇注释图像的必要性。我的数据集由大约 35k 个图像(7 个类别)组成,单手注释每个图像会花费太多时间。如果有必要,注释图像最快的方法是什么?另外,我应该做什么类型的注释(例如 bboxes)?

目前我的 CNN 通常具有约 93^ val 准确度和 97% 训练准确度,但现实生活结果和混淆矩阵表明它表现不佳(平均精度约为 40%)。注释值得花时间吗?

machine-learning image-processing computer-vision annotations conv-neural-network
1个回答
0
投票

对于您的数据集,有 7 个类别和 35k+ 图像,我认为注释确实是有益的。为了加快这一过程,请考虑使用半监督学习或利用预先训练的模型进行迁移学习,以提供更好的性能。对于注释类型,边界框(bbox)对于对象定位任务非常有用,而语义分割掩模可以增强分割任务。考虑到 CNN 的性能差距,在注释上投入时间来改善现实世界的结果是值得的。

© www.soinside.com 2019 - 2024. All rights reserved.