如何使用Python读取图像中的七段显示和标志?

问题描述 投票:0回答:1

我有一堆能量计的照片。在每张照片中,仪表上都写有信息,还有一个七段显示屏,读数以千瓦时为单位。另外,还有仪表制造商的标志。我想提取电表序列号、电表制造商、电表读数(以 kWh 为单位)(7 段显示)等信息。

我使用 easyocr 模块来检测文本,并使用它来提取电表序列号,但对于 kWh 读数,easyocr 无法检测数字。

目前我有2个要求,一是从7段显示器中检测数字,二是从仪表中的标志符号检测制造商。只有 2-3 个不同的制造商,所以我只需要根据 2-3 个徽标进行培训。但我不知道该怎么做。

任何有关步骤 kr 程序的帮助或指导将不胜感激。

我尝试用谷歌搜索,在 YouTube 上搜索,但没有得到任何相同的路线图。我尝试过其他 ocr 模块,例如 tesseract,但也失败了。

python machine-learning image-processing artificial-intelligence ocr
1个回答
0
投票

尝试使用这个存储库。 https://github.com/renjithsasidharan/seven-segment-ocr

根据他们提供的结果,它似乎有效。由于这是在 Tensorflow lite 中实现的,我认为这对于更快的推理来说是理想的选择。

如果你也有时间看看这篇论文

© www.soinside.com 2019 - 2024. All rights reserved.