Mask R-CNN实例分割与对象检测

我有一个对象检测问题，其中我的数据由带有边界框的图像组成。我一直在审查几种先进的对象检测网络（https://paperswithcode.com/task/object-detection），并且在查看实例分割结束和对象检测开始的位置时遇到了麻烦。

我正在尝试找出使用边界框注释数据进行训练时，哪种方法效果最好。像遮罩R-CNN会比更快的R-CNN表现更好，还是要提高性能，是否需要在微调之前在像素级别对我的所有数据进行分割而不是用边框进行注释？如果在边界框上进行训练并且没有分段数据，那么掩码R-CNN是否会胜过更快的R-CNN？我知道您可以使用遮罩R-CNN进行边界框推断，但是您可以在不进行像素级分割的情况下训练模型吗？不需要像素级分割训练的最新的对象检测技术是什么？

1
投票

像遮罩R-CNN之类的东西会比较快的R-CNN表现更好，还是要提高性能，是要求我的所有数据都在像素级别进行分割，而不是在微调之前用边界框注释？

是，Mask R-CNN确实需要在像素级别对数据进行分割，因为它是一种分割模型，它比对象检测模型高一个级别，并且更复杂。

如果在边界框上进行训练并且没有分段数据，蒙版R-CNN是否会胜过更快的R-CNN？

否，Mask R-CNN基于Faster R-CNN对象检测，并添加了细分模块。因此，如果使用边框对数据进行注释，则Faster R-CNN就足够了，使用Mask R-CNN也没有意义。

我知道您可以使用遮罩R-CNN进行边界框推断，但是您可以在不进行像素级分割的情况下训练模型吗？

是的，也许您可以通过这种方式训练模型，但是性能不会很好。这样做也是没有意义的，因为Mask R-CNN比Faster R-CNN稍慢。

不需要像素级分割训练的最新的对象检测技术是什么？

在对象检测和分段之间进行选择取决于应用程序和您的用途。例如，如果您正在处理医学图像，并尝试检测肿瘤，则需要进行细分，但是例如，要在街道上检测汽车，您可能并不在意汽车的确切边界，而只是想知道汽车在图像上的位置。对于此类应用程序，对象检测就足够了。对于最新技术对象检测也是实时的，我建议使用YOLO，因为它非常快，并且如果不是更好的话，其性能也比“更快的R-CNN”好。

0
投票

仅在Rohit Malhotra等人开发的工作中添加更多上下文。 [1]作者使用了一个深层的[[Mask R-CNN]]模型，这是一种用于对象实例分割的深度学习框架，用于检测和量化个体的数量。在这项工作中，他们使用Mask R-CNN来检测人数。另一方面，通过添加分支以预测每个感兴趣区域（RoI]的分割掩码，将[[Faster R-CNN [2]扩展为Mask R-CNN >）产生于更快的R-CNN。最后，作者根据图像序列上的Precision和Recall来测量模型。结果显示在paper中。该方法可用于收集可靠，准确的数据，以研究就诊政策的影响，医疗程序的频率和时间对患者的睡眠-觉醒周期以及结果的影响，例如住院时间。

Mask R-CNN

也可以用于关键点检测，可以用于医院中患者的姿势检测。

[[1] Rohit Malhotra，K.，达沃迪，A.，Siegel，S.，Bihorac，A。和Rashidi，P.，2018年。使用深罩R-CNN自主检测重症监护室中的干扰。在IEEE计算机视觉和模式识别研讨会的会议记录中（第1863-1865页）。

[[2] Ren，S.，He，K.，Girshick，R. and Sun，J.，2015. Faster r-cnn：借助区域提议网络实现实时目标检测。在神经信息处理系统进展中（第91-99页）。

问题描述投票：1回答：2

2个回答

最新问题

Mask R-CNN实例分割与对象检测

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2