在 Google-Colaboratory (Python) 中,我训练了一个模型来检测视频中的球对象。 我想查看模型的结果,我使用以下命令: 结果=模型('V3.mp4',save=True,save_txt=True) 除了保存带有球检测的视频之外,我还添加了命令“save_txt=True”,因为我还需要生成一个 .txt 文件,其中包含模型检测到的各个帧的坐标。
在每一帧中,仅检测到一个球,有以下数值: 0 0.777123 0.55625 0.0212264 0.0625
我使用 yolov8 作为基础模型和训练模型的权重。
感谢您的帮助。
你能告诉我这五个值到底代表什么吗?
这里的结果以 YOLO 对象检测数据集格式返回:
class_id x_center y_center width height
0 0.777123 0.55625 0.0212264 0.0625
盒子坐标采用 归一化 xywh 格式(从 0 到 1)。要获取这些以像素为单位的值,请将 x_center 和宽度乘以图像宽度,并将 y_center 和高度乘以图像高度。
有关检测结果的更多信息可以从文档中获取:https://docs.ultralytics.com/modes/predict/#working-with-results