为 CNN 注释图像有多大必要？如果可以的话，最快的方法是什么？

问题描述投票：0回答：1

我有一个带有 keras 和 tensorflow 的 CNN，并且很好奇注释图像的必要性。我的数据集由大约 35k 个图像（7 个类别）组成，单手注释每个图像会花费太多时间。如果有必要，注释图像最快的方法是什么？另外，我应该做什么类型的注释（例如 bboxes）？

目前我的 CNN 通常具有约 93^ val 准确度和 97% 训练准确度，但现实生活结果和混淆矩阵表明它表现不佳（平均精度约为 40%）。注释值得花时间吗？

machine-learning

image-processing

computer-vision

annotations

conv-neural-network

1个回答

0
投票

对于您的数据集，有 7 个类别和 35k+ 图像，我认为注释确实是有益的。为了加快这一过程，请考虑使用半监督学习或利用预先训练的模型进行迁移学习，以提供更好的性能。对于注释类型，边界框（bbox）对于对象定位任务非常有用，而语义分割掩模可以增强分割任务。考虑到 CNN 的性能差距，在注释上投入时间来改善现实世界的结果是值得的。

为 CNN 注释图像有多大必要？如果可以的话，最快的方法是什么？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1