我想构建一个多数字分类器

问题描述 投票:0回答:2

我使用tensorflow构建了一个mnist-digit分类器。现在我想使用上面训练的模型对图像中的多个数字进行分类。我怎样才能做到这一点? The images look like this

deep-learning computer-vision object-detection mnist
2个回答
0
投票

您需要详细说明图像中的数字的外观。 MNIST是灰度手写数字的数据集,因此仅可以预期在该数据集上训练的分类器在与训练数据相似的图像上表现良好,即具有单个数字的灰度图像。否则,MNIST训练的分类器无用。


0
投票

您所描述的是从纯分类器到分类器以及本地化(也称为检测)的过渡。

至少有两种一般方法:

  1. 使用滑动窗口方法(不同的步幅和大小)移动图像并将窗口移动到分类器(您可以重复使用已经训练过的模型,假设图像中的数字“看起来”像您训练的那样)。
  2. 这个特定任务也有神经网络架构。看看物体检测网络(例如YOLO,RFCN等。在这种情况下,您将需要训练一个新模型)。
© www.soinside.com 2019 - 2024. All rights reserved.