我已经出于目的使用Tesseract OCR,但到目前为止我还不太走运。
这是我的代码:
import pytesseract
import sys
import argparse
try:
import Image
except ImportError:
from PIL import Image
from subprocess import check_output
def resolve(path):
check_output(['C:\Program Files\ImageMagick-7.0.9-Q16\convert.exe', path, '-resample', '600', path])
return pytesseract.image_to_string(Image.open(path))
if __name__=="__main__":
argparser = argparse.ArgumentParser()
argparser.add_argument('path',help = 'image path at OCR')
args = argparser.parse_args()
path = args.path
print('Resolving the image...')
captcha_text = resolve(path)
print('Result: ',captcha_text)`
这是我程序的输出:
C:\Users\Foussy\PycharmProjects\03_Imagedecoder>python main.py C:\Users\Foussy\Pictures\4570502--437826.jpeg
Resolving the image...
Result:
似乎我的程序无法解码图像。我尝试用更“明显”的文本解码图像,并且效果很好。我还尝试了其他几种此类验证码示例,但均未成功。您推荐我做什么?
最终,我想编写一个程序来自动解码像这样的图像,因此,除非有一种可靠且可靠的方式自动修改图像,以使Tesseract兼容,我没有其他解决此问题的方法。如果某人知道某个图书馆或其他内容,将会有所帮助。
此python库可能会帮助https://pypi.org/project/captcha-solver/