我的问题不是使用多边形,圆形或直线对数据进行精确注释,而是如何使用这些注释数据对“ 。tfrecord”文件进行润色并执行对象检测。我看到的教程使用矩形注释,如下所示:taylor swift detection raccon detection
如果我要检测的对象(管道)不太靠近,对我来说将是一个很好的选择。
以PASCAL VOC格式绘制的矩形示例:
<bndbox>
<xmin>82</xmin>
<xmax>172</xmax>
<ymin>108</ymin>
<ymax>146</ymax>
</bndbox>
是否可以添加“遮罩”以突出显示此边界框的某些部分?
如果不清楚,请告诉我。
您可以进行实例分割而不是对象检测,因为您的对象彼此非常靠近,可以在其中使用多边形生成蒙版和边界框来训练模型。
这里展示得很好并且易于使用,用于mask-rcnn(实例分割的种类)] >>