tesseract无法识别一个数字图像

问题描述 投票:2回答:2

我正在使用tesseract与python。它可识别几乎所有带有2个或更多数字或字符的图像。但tesseract无法识别只有一个数字的图像。我试图使用命令行,它给了我“空页”作为响应。

我不想用“仅数字”训练tesseract因为我也认识到了人物。

问题是什么?

在图像下方,tesseract无法识别。

enter image description here

码:

 #getPng(pathImg, '3') -> creates the path to the figure.
 pytesseract.image_to_string( Image.open(getPng(pathImg, '3')) 
tesseract
2个回答
2
投票

如果添加参数--psm 13它应该有效,因为它会将其视为原始文本行,而不搜索页面和段落。

所以尝试:

pytesseract.image_to_string(PATH, config="--psm 13") 

0
投票

尝试将图像转换为灰度,然后转换为二进制图像,然后很可能会读取。如果没有复制图像,那么你有两个字母要读。所以,您只需提取单个字母即可

© www.soinside.com 2019 - 2024. All rights reserved.