我有这样的照片:
我试图用Python中的pytesseract
读取它:
from PIL import Image
import pytesseract
import numpy
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
im = Image.open("11.jpg")
text = pytesseract.image_to_string(im,lang = "eng")
print(text)
但是pytesseract
无法读取它。我也尝试过opencv
,但找不到解决方案。
tesseract
,gocr
和ocrad
来读取验证码文本。关键步骤是在尝试读取图像之前先清洁图像。该站点上提供的示例使用一个简单的阈值过滤器,但是由于您的图像是彩色的,因此可能无法正常工作。
您应该尝试不同的图像处理技术,以查看是否可以充分整理图像以识别文本。
如上所述,我将回应@SiHa的评论,并建议此活动不道德。尝试破坏CAPTCHA保护表明,无论服务器所有者是在保护带宽还是在保护自己的业务,都缺乏对服务器所有者的尊重。