Tesseract OCR 错误结果

问题描述 投票:0回答:1

我有这样的图片 当尝试使用 C# TesseractOCR 读取它们时,我有时会得到结果 38845283-05,这是不正确的,因为开头的“3”不应该在那里。 这是直接来自 Tesseract 结果的 page.ThresholdedImage 图像: 即使我将此图像传递给 Tesseract,我也会得到相同的错误 38845283-05 结果。

或者这样:即使我将 ROI 区域设置得非常靠近字符,我也得到 13.11.238。

好像 3 或 8 被识别了两次。

我尝试过不同的EngineModes、不同的PageSegModes,但我还没有找到可靠的设置。

你有什么建议吗? (培训除外:)) 谢谢你。

即使在 tesseract.projectnaptha.com 上,结果也是错误的:

c# ocr tesseract
1个回答
0
投票

tesseract 对你的图像没有问题:

tesseract WOsO1.png -
8845283-05

tesseract hTTcW.png -
13.11.23

IMO,你应该检查你的代码,确保使用最新版本,正确的语言数据等......

© www.soinside.com 2019 - 2024. All rights reserved.