如何在 Pytesseract 中将低质量图像转换为数据帧?

问题描述 投票:0回答:0

我有一个客户想要将他们的运动卡销售导入到sql数据库中。

问题是,他们通过给销售的卡片拍照并在图像上绘制销售价格来跟踪销售情况。 我想编写一个 python 脚本,它基本上可以获取卡片的标题和价格并将其放入 pandas 数据框中。有什么办法可以做到这一点?我试过使用 pytesseract 将图像转换为字符串,但它似乎无法从图像中捕获任何字符串,可能是因为它们的照片质量很差。

#Define path to tessaract.exe
path_to_tesseract = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

#Define path to image
path_to_image = r"C:image_path\\"

#Point tessaract_cmd to tessaract.exe
pytesseract.tesseract_cmd = path_to_tesseract


#Extract text from image
text = pytesseract.image_to_string(Image.open(path_to_image))

print(text)
python python-tesseract
© www.soinside.com 2019 - 2024. All rights reserved.