对燃气表进行 OCR

问题描述 投票:0回答:2

我想在燃气表上执行 OCR,以便它可以读取值。我想要执行 OCR 的仪表示例:

在这种情况下,OCR 应返回 25539144。

正如您所看到的,有一个问题:仪表周围有很多文字。因此,普通的 OCR 库在这里不起作用,因为它也会返回其周围的文本。

我已经尝试过通过对象检测来检测仪表,但似乎唯一效果良好的方法(因为我只有 50 张图片)是 azure 认知服务。问题是稍后它应该能够在实时流中检测到它,因此网络服务是不可能的。

任何人都可以帮助我朝正确的方向解决这个问题吗?

image image-processing machine-learning computer-vision ocr
2个回答
1
投票

如果有关使用颜色的评论对您没有帮助,那么您可以尝试以下方法:

一种可能的方法是训练模型(可能是神经网络)以围绕使用数字绘制边界框。

您将必须手工画一些方框来提供训练示例。

运行此“边界框创建模型”后,您可以裁剪掉所有不相关的内容,并且您将拥有一个新的训练集,其中包含更容易学习的示例。

然后您可以尝试在这个新数据集上重新训练您的 ocr 模型。


0
投票

有点晚了,但可能对某人有帮助。一段时间以来,我一直在谷歌上搜索和研究完全相同的问题。看起来应该可以使用一些 OCR 库或者 OpenCV 首先检测感兴趣的区域。然而,对我来说,最简单的解决方案是用物理胶带粘掉不相关的部分。我知道这是一个完全愚蠢的解决方案,但我更喜欢它而不是一个不是 100% 可靠的复杂系统。

我确实认识到这并不能解决一般问题,但如果

做起来非常简单
  1. 您可以物理访问仪表
  2. 没有人介意你把不相关的部分用胶带粘下来;)

有时,当根本问题有一个非常简单且实用的解决方案时,工程师(包括我)会尝试找到完美的解决方案。

© www.soinside.com 2019 - 2024. All rights reserved.