我正在使用tesseract与python。它可识别几乎所有带有2个或更多数字或字符的图像。但tesseract无法识别只有一个数字的图像。我试图使用命令行,它给了我“空页”作为响应。
我不想用“仅数字”训练tesseract因为我也认识到了人物。
问题是什么?
在图像下方,tesseract无法识别。
码:
#getPng(pathImg, '3') -> creates the path to the figure.
pytesseract.image_to_string( Image.open(getPng(pathImg, '3'))
如果添加参数--psm 13
它应该有效,因为它会将其视为原始文本行,而不搜索页面和段落。
所以尝试:
pytesseract.image_to_string(PATH, config="--psm 13")
尝试将图像转换为灰度,然后转换为二进制图像,然后很可能会读取。如果没有复制图像,那么你有两个字母要读。所以,您只需提取单个字母即可