计算机视觉模型的训练/测试数据的格式是什么

问题描述 投票:-1回答:1

我正在尝试建立CV模型以检测视频中的对象。我大约有6个视频,这些视频具有训练模型所需的内容。这些是我试图检测的东西,例如车道,其他车辆等。

我很好奇我需要用来训练模型的数据集的格式。我可以将每个视频的每一帧都转换成图像,并创建一个庞大的图像库以进行训练,也可以直接使用这些视频。您认为哪种方法更好?

如果这不是直接编程问题,我深表歉意。我正在尝试收集数据,对此我无法下定决心。

deep-learning computer-vision
1个回答
0
投票

Yolo版本3是一个很好的起点。经过训练的模型将具有一个.weight文件和一个.cfg文件,可用于从网络摄像头,计算机中的视频或在具有opencv的Android中检测视频中的对象。

在opencv python中,可以使用cv.dnn.readNetFromDarknet("yolov3_tiny.cfg", "CarDetector.weights")加载训练后的模型。

在android类似代码中,

String tinyYoloCfg = getPath("yolov3_tiny.cfg", this);
String tinyYoloWeights = getPath("CarDetector.weights", this);
Net tinyYolo = Dnn.readNetFromDarknet(tinyYoloCfg, tinyYoloWeights);

可以在这里找到功能参考,https://docs.opencv.org/4.2.0/d6/d0f/group__dnn.html

您的视频帧需要用生成yolo格式的边框的工具进行注释,并且有很多可用的工具。为了训练自定义模型,该存储库包含所有必要的信息,https://github.com/AlexeyAB/darknet

© www.soinside.com 2019 - 2024. All rights reserved.