是否可以使用多边形数据注释执行张量流对象检测？

Question

我的问题不是使用多边形，圆形或直线对数据进行精确注释，而是如何使用这些注释数据对“ 。tfrecord”文件进行润色并执行对象检测。我看到的教程使用矩形注释，如下所示：taylor swift detection raccon detection

如果我要检测的对象（管道）不太靠近，对我来说将是一个很好的选择。

以PASCAL VOC格式绘制的矩形示例：

<bndbox>
    <xmin>82</xmin>
    <xmax>172</xmax>
    <ymin>108</ymin>
    <ymax>146</ymax>
</bndbox>

是否可以添加“遮罩”以突出显示此边界框的某些部分？

如果不清楚，请告诉我。

Answer 1

您可以进行实例分割而不是对象检测，因为您的对象彼此非常靠近，可以在其中使用多边形生成蒙版和边界框来训练模型。

这里展示得很好并且易于使用，用于mask-rcnn（实例分割的种类）] >>