KerasOCR、EasyOCR、Pytesseract 无法识别简单数字

问题描述 投票:0回答:1

我试图在我的单个字符图像上运行 OCR,所有图像都是数字。我尝试在图像上运行 EasyOCR、Keras-OCR 和 Pytesseract,但没有返回正确的输出。我什至尝试了 MNIST,但输出仍然是错误的(它说输出是 5 而不是 7)。

我该怎么办?包括图片。

Image of character '7'

7 的图像

Image of character '9'

9 的图像

如果有预处理,我应该添加哪些方法?或者我应该做点别的吗?

ocr tesseract python-tesseract image-recognition easyocr
1个回答
0
投票

每个 OCR 都针对不同类型的图像进行训练,请查看这篇文章,总结一下,“Tesseract”在高分辨率图像上表现良好。某些形态学操作(例如膨胀、腐蚀、OTSU 二值化)可以帮助提高 pytesseract 的性能。

“EasyOCR”是轻量级模型,为收据或 PDF 转换提供了良好的性能。它通过 pdf 文件、收据、账单等有组织的文本提供更准确的结果。

“Keras-OCR”是图像特定的 OCR 工具。如果文本位于图像内部并且其字体和颜色没有组织,Keras-ocr 会给出良好的结果。

对于这种数字,我推荐使用 Tesseract,如果问题仍然存在,请尝试创建自己的数字数据集(或搜索现有数据集)并微调现有模型。

© www.soinside.com 2019 - 2024. All rights reserved.