对燃气表进行 OCR

我想在燃气表上执行 OCR，以便它可以读取值。我想要执行 OCR 的仪表示例：

在这种情况下，OCR 应返回 25539144。

正如您所看到的，有一个问题：仪表周围有很多文字。因此，普通的 OCR 库在这里不起作用，因为它也会返回其周围的文本。

我已经尝试过通过对象检测来检测仪表，但似乎唯一效果良好的方法（因为我只有 50 张图片）是 azure 认知服务。问题是稍后它应该能够在实时流中检测到它，因此网络服务是不可能的。

任何人都可以帮助我朝正确的方向解决这个问题吗？

1
投票

如果有关使用颜色的评论对您没有帮助，那么您可以尝试以下方法：

一种可能的方法是训练模型（可能是神经网络）以围绕使用数字绘制边界框。

您将必须手工画一些方框来提供训练示例。

运行此“边界框创建模型”后，您可以裁剪掉所有不相关的内容，并且您将拥有一个新的训练集，其中包含更容易学习的示例。

然后您可以尝试在这个新数据集上重新训练您的 ocr 模型。

0
投票

有点晚了，但可能对某人有帮助。一段时间以来，我一直在谷歌上搜索和研究完全相同的问题。看起来应该可以使用一些 OCR 库或者 OpenCV 首先检测感兴趣的区域。然而，对我来说，最简单的解决方案是用物理胶带粘掉不相关的部分。我知道这是一个完全愚蠢的解决方案，但我更喜欢它而不是一个不是 100% 可靠的复杂系统。

我确实认识到这并不能解决一般问题，但如果

做起来非常简单

您可以物理访问仪表
没有人介意你把不相关的部分用胶带粘下来;)

有时，当根本问题有一个非常简单且实用的解决方案时，工程师（包括我）会尝试找到完美的解决方案。

问题描述投票：0回答：2

2个回答

最新问题

对燃气表进行 OCR

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2