我在使用TessBaseAPI()时遇到问题

问题描述 投票:0回答:2

使用代码:

import tesseract

api = tesseract.TessBaseAPI()

我有一个错误:

AttributeError:'module' object has no attribute 'TessBaseAPI'

使用sudo apt-get install tesseract-ocr

python image-processing python-tesseract
2个回答
0
投票

你确定正确的进口不是import pytesseract

如果它是import tesseract,你安装了它的最新版本并且你使用了pip吗?

也许这个link可以帮助你。

你试过这个:

from tesserocr import PyTessBaseAPI

images = ['sample.jpg', 'sample2.jpg', 'sample3.jpg']

with PyTessBaseAPI() as api:
    for img in images:
        api.SetImageFile(img)
        print api.GetUTF8Text()
        print api.AllWordConfidences()

0
投票

在我的例子中,我需要安装C ++ tesseract库(不仅仅是python包装器)并在初始化tesserocr API时提供它的路径:

from tesserocr import PyTessBaseAPI
api = PyTessBaseAPI(lang='eng', path=r'C:\python\envs\python36\Lib\site-packages\tesserocr\Tesseract-OCR\tessdata')

对于Windows 7,我有一个Windows安装程序,如下所示:https://osdn.net/projects/sfnet_tesseract-ocr-alt/downloads/tesseract-ocr-setup-3.02.02.exe/

请注意,版本4.0,所以你应该谷歌最新版本。

此外 - 该路径专门用于从库中创建的tessdata文件夹。

© www.soinside.com 2019 - 2024. All rights reserved.