从图像中读取文本

问题描述 投票:-2回答:1

我有这样的照片:

“

我试图用Python中的pytesseract读取它:

from PIL import Image
import pytesseract
import numpy 
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
im = Image.open("11.jpg")
text = pytesseract.image_to_string(im,lang = "eng")
print(text)

但是pytesseract无法读取它。我也尝试过opencv,但找不到解决方案。

python python-3.x opencv ocr
1个回答
0
投票
[This blog有一篇博文,其中提到了尝试使用tesseractgocrocrad来读取验证码文本。

关键步骤是在尝试读取图像之前先清洁图像。该站点上提供的示例使用一个简单的阈值过滤器,但是由于您的图像是彩色的,因此可能无法正常工作。

您应该尝试不同的图像处理技术,以查看是否可以充分整理图像以识别文本。

如上所述,我将回应@SiHa的评论,并建议此活动不道德。尝试破坏CAPTCHA保护表明,无论服务器所有者是在保护带宽还是在保护自己的业务,都缺乏对服务器所有者的尊重。

© www.soinside.com 2019 - 2024. All rights reserved.