如何从pts标签文件导出TFRecords用于Tensorflow对象检测api？

Question

通常，当我们从xml标签文件（例如，从labelimg）生成TFRecords时，存在x.min，x.max，y.min和y.max的值，它们显示了方形标签。我们可以从中制作一个CSV数据并从中生成TFRecords。

但是对于pts，其值是一个非正方形的边界框，例如：

bounding_box: 534.588998862 232.095176337; 101.596234357 388.45367463; 51.3295676906 249.25367463; 484.322332196 92.8951763367

因此有四个x和y点，而不仅仅是labelimg给出的两个点。有人可以向我解释如何从pts生成TFRecord吗？

Answer 1

因此，以防万一其他人有相同的问题，我编写了一个脚本，使用xmin xmax ymin ymax将这四个点作为一个正方形，因此我们可以像从xml labelimg一样轻松地获取tfrecord。

这里是：

import os
import glob
import pandas as pd
from PIL import Image
import csv

for pts_file in glob.glob("./labels" + '/*.pts'):
    with open(pts_file) as f:
        im=Image.open("./img/" + pts_file[9:-3] + "jpg")
        filename = pts_file[9:-3] + "jpg"
        width = str(im.size[0])
        height = str(im.size[1])
        classs = "fish"
        lines = f.readlines() 
        content = [line.split(' ')for line in open (pts_file)]
        xmax = max(int(float(content[0][1])), int(float(content[0][4])), int(float(content[0][7])), int(float(content[0][10])))
        xmin = min(int(float(content[0][1])), int(float(content[0][4])), int(float(content[0][7])), int(float(content[0][10])))
        ymax = max(int(float(content[0][3][0:5])), int(float(content[0][6][0:5])), int(float(content[0][9][0:5])), int(float(content[0][11][0:5])))
        ymin = min(int(float(content[0][3][0:5])), int(float(content[0][6][0:5])), int(float(content[0][9][0:5])), int(float(content[0][11][0:5])))

        fields=[filename,width,height,classs,xmin,ymin,xmax,ymax]
        with open(r'name', 'a', newline='') as f:
            writer = csv.writer(f)
            writer.writerow(fields)        

print('Successfully converted pts to csv.')

如何从pts标签文件导出TFRecords用于Tensorflow对象检测api？

问题描述投票：0回答：1

1个回答

最新问题

如何从pts标签文件导出TFRecords用于Tensorflow对象检测api？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1