在Python中从图像读取TD1机读区

问题描述 投票:0回答:2

我正在开发一个程序,该程序应该检测 MRZ(TD1) 文本并将其作为字符串从阿联酋卡背面返回。我使用 Python 和“mrz_reader”包对护照(TD3)做了同样的事情,该包使用 tesseract 将图像转换为文本,其工作完美。但我对阿联酋卡进行了同样的尝试,结果与实际结果相差甚远。我尝试了几种解决方案,例如使用不同的库来检测 mrz,在超正方字符串检测之前通过 opencv 应用一些图像修复,但要么未检测到 mrz 区域,要么结果字符串根本不正确。

顶级酋长国 ID 的结果:J784197619049089LSLE<<<<<<<<<<<6<<<<<<<<<<<<<<<<

我已经在互联网上检查了解决方案,但找不到任何适合这种情况的解决方案。如何获得阿联酋卡 mrz 扫描的准确结果?

python opencv python-tesseract
2个回答
0
投票

您应该使用Paddle OCR进行提取,它效果很好,我已经测试了您分享的卡片图像,就MRZ而言,结果很好。我只使用了英文模型和英文词典。您也可以根据您的用例训练模型,并且也支持阿拉伯语。更多信息可以参考https://github.com/PaddlePaddle/PaddleOCR

结果: Paddle OCR Result


-2
投票

您可以通过电子邮件给我发短信吗?我们可以讨论这个。

© www.soinside.com 2019 - 2024. All rights reserved.