无法处理数据集......用于机器学习[关闭]

问题描述 投票:0回答:1

有很多数据集存储方式……比如“.h5”文件或“.NPY”文件。但是对于不同的模型有不同的标签来注释对象或屏蔽它。我如何处理每种类型的数据集。只是征求一些建议。

仅供参考。这是我第一次进行计算机验证。我需要将基线从分类问题更改为图像分割。

python opencv
1个回答
-1
投票

为计算机视觉处理不同类型的数据集可能具有挑战性,这也用于 Data Science,但是您可以遵循一些通用步骤以使其更容易:

  1. 首先,您需要了解您要解决的问题以及您需要的数据类型。例如,如果要进行图像分割,则需要带有像素级注释的图像,这些注释指示哪个对象或区域属于哪个类1。
  2. 其次,您需要找到符合您的问题和数据要求的合适数据集。有许多用于计算机视觉的开源数据集,您可以根据自己的目的使用或修改这些数据集2。您还可以通过自己收集和标记图像或使用在线工具1来创建自己的数据集。
  3. 第三,您需要根据模型的输入和输出规格对数据集进行预处理和格式化。例如,如果您使用“.h5”文件或“. NPY' 文件,您需要将图像和标签转换为数组并以这些格式存储。您还需要根据需要对数据进行规范化、调整大小、扩充、拆分和洗牌3。
  4. 第四,您需要使用适当的库或框架(例如 TensorFlow 或 PyTorch3)将数据集加载并馈送到模型中。您还需要使用准确度、精确度、召回率或 IoU(并集交集)等指标来监控和评估模型在数据集上的性能。

资源 https://www.v7labs.com/blog/computer-vision-datasets

© www.soinside.com 2019 - 2024. All rights reserved.