我有一堆能量计的照片。在每张照片中,仪表上都写有信息,还有一个七段显示屏,读数以千瓦时为单位。另外,还有仪表制造商的标志。我想提取电表序列号、电表制造商、电表读数(以 kWh 为单位)(7 段显示)等信息。
我使用 easyocr 模块来检测文本,并使用它来提取电表序列号,但对于 kWh 读数,easyocr 无法检测数字。
目前我有2个要求,一是从7段显示器中检测数字,二是从仪表中的标志符号检测制造商。只有 2-3 个不同的制造商,所以我只需要根据 2-3 个徽标进行培训。但我不知道该怎么做。
任何有关步骤 kr 程序的帮助或指导将不胜感激。
我尝试用谷歌搜索,在 YouTube 上搜索,但没有得到任何相同的路线图。我尝试过其他 ocr 模块,例如 tesseract,但也失败了。
尝试使用这个存储库。 https://github.com/renjithsasidharan/seven-segment-ocr
根据他们提供的结果,它似乎有效。由于这是在 Tensorflow lite 中实现的,我认为这对于更快的推理来说是理想的选择。
如果你也有时间看看这篇论文