计算机视觉模型的训练/测试数据的格式是什么

Question

我正在尝试建立CV模型以检测视频中的对象。我大约有6个视频，这些视频具有训练模型所需的内容。这些是我试图检测的东西，例如车道，其他车辆等。

我很好奇我需要用来训练模型的数据集的格式。我可以将每个视频的每一帧都转换成图像，并创建一个庞大的图像库以进行训练，也可以直接使用这些视频。您认为哪种方法更好？

如果这不是直接编程问题，我深表歉意。我正在尝试收集数据，对此我无法下定决心。

Answer 1

Yolo版本3是一个很好的起点。经过训练的模型将具有一个.weight文件和一个.cfg文件，可用于从网络摄像头，计算机中的视频或在具有opencv的Android中检测视频中的对象。

在opencv python中，可以使用cv.dnn.readNetFromDarknet("yolov3_tiny.cfg", "CarDetector.weights")加载训练后的模型。

在android类似代码中，

String tinyYoloCfg = getPath("yolov3_tiny.cfg", this);
String tinyYoloWeights = getPath("CarDetector.weights", this);
Net tinyYolo = Dnn.readNetFromDarknet(tinyYoloCfg, tinyYoloWeights);

可以在这里找到功能参考，https://docs.opencv.org/4.2.0/d6/d0f/group__dnn.html

您的视频帧需要用生成yolo格式的边框的工具进行注释，并且有很多可用的工具。为了训练自定义模型，该存储库包含所有必要的信息，https://github.com/AlexeyAB/darknet

计算机视觉模型的训练/测试数据的格式是什么

问题描述投票：-1回答：1

1个回答

最新问题

计算机视觉模型的训练/测试数据的格式是什么

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1