ImportError:无法使用pytesseract导入名称'image_to_data'

问题描述 投票:0回答:1

我正在使用OCR从image.image_to_string中提取文本及其坐标(边界框)工作正常,但image_to_data输出错误,它是提取文本边界框所必需的。知道为什么会这样吗?我正在使用Windows 10。

import pytesseract
import cv2
pytesseract.pytesseract.tesseract_cmd = 'C:/Users/Anwer/AppData/Local/Tesseract-OCR/tesseract.exe'
from PIL import Image
from pytesseract import image_to_data
img = cv2.imread('C:/Users/Anwer/Desktop/Density Plot.png', 1) 
cv2.imwrite("Graph.jpeg",img)
img=Image.open('Graph.jpeg')
d=image_to_data(img,output_type=Output.DICT)
n_boxes = len(d['level'])
for i in range(n_boxes):
    (x, y, w, h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i])
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv2.imshow('img', img)
cv2.waitKey(0)

我希望结果输出我的边界框坐标,但不导入image_to_data函数。事实上,没有导入除image_to_string之外的任何功能。

python-3.x ocr python-tesseract
1个回答
0
投票

好的,我自己解决了这个问题。我有一个4.0的tesseract版本。我卸载它,然后安装旧的tesseract版本3.05.02。在那之后,一切似乎都很好。此外,一旦这样做,请卸载并安装pytesseract。

© www.soinside.com 2019 - 2024. All rights reserved.