python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

如何解决“ PATH”问题?

我创建了一个将图像打印为文本的程序。环境变量变量名称:pytesseract变量值:pytesseract.pytesseract.tesseract_cmd = r'C:\ Program Files(x86)\ Tesseract -...

回答 1 投票 0

如何使用python从图像中提取文本或数字

我想从这样的图像中提取文本(主要是数字),我尝试了此代码,从PIL导入pytesseract.pytesseract.tesseract_cmd = r'C:\ Program Files \ Tesseract-OCR \ ...

回答 1 投票 1


裁剪图像页脚并获得原始位置

我需要裁剪图像以仅获取页脚信息。有了这些信息,我得到了找到的文本的位置(使用pytesseract),但是只有页脚图像。因此,当我使用...

回答 1 投票 1

tesseract中以下代码的字典输出的键值表示什么?

我正在python中使用以下代码:我正在字典中获取以下键值:'block_num''conf''level''line_num''page_num''par_num','text','top','宽度','word_num','...

回答 1 投票 0

我如何解决TesseractNotFoundError?

我尝试像其他人提到的那样添加到path变量,但是仍然收到相同的错误。起作用的是将其添加到我的脚本中:

回答 21 投票 50

Tesseract OCR产生空结果

我需要从图像中提取数字(请参阅示例图像)。我尝试了pytesseract,但是它不起作用,它产生了空结果。以下是我正在使用的代码代码import pytesseract import cv2 img = ...

回答 1 投票 0

如何从复杂的数学验证码中提取数字和数学运算符

我想使用Python自动访问使用此类验证码的网站。我尝试使用pytesseract,但没有任何结果。

回答 1 投票 -2

Pytesseract OCR对具有表结构的图像的坏字符识别

我使用代码来定位文本框并在它们周围创建一个矩形。这使我可以在图像中的表结构周围重建网格。但是,即使文本框检测非常有效...

回答 1 投票 1

jupyter笔记本由于“未加载库”错误而无法启动

Jupyter笔记本电脑始终可以正常启动。直到昨天...我尝试通过pip安装pytesseract,然后又去做其他事情,现在当我尝试启动jupyter笔记本时,这就是我...

回答 1 投票 0

[使用python从扫描的pdf中提取Pdf数据

我是通过tesseract ocr从扫描的pdf中提取数据的,我能够提取数据,但准确性不高。在许多地方,它显示了错误的数据,所以我可以通过...

回答 1 投票 1

是否可以使用pytesseract从图像的特定部分提取文本

我在图像中具有边框(矩形的坐标),并希望在该坐标内提取文本。如何使用pytesseract在该坐标内提取文本?我尝试复制图像...

回答 1 投票 -1

将HOCR输出转换为字符串(用于正则表达式的策略是什么?

我正在与Pytesseract合作,并希望将HOCR输出转换为字符串。当然,Pytesseract中实现了这种功能,但我想了解更多可能的...

回答 1 投票 0

是什么导致pytesseract读取双行图像的顶部或底部文本行,这取决于使用的是opencv还是枕头?

编辑:我忘了处理能解决阅读问题的图像。仍然想知道是什么使Tesseract只读取未处理图像(同一图像,两个不同的...的顶部或底部)?

回答 1 投票 1

为什么pytesseract无法正确识别?

好吧,我一直在尝试将图像更改为任何可用的图像,但是我似乎找不到正确的设置。.这是图像:正如您所看到的那样,图片已经和任何东西一样简单,但是仍然.. 。

回答 1 投票 0

pytesseract为什么能正确识别?

好吧,我一直在尝试将图像更改为任何可用的图像,但是我似乎找不到正确的设置。.这是图像:正如您所看到的那样,图片已经和任何东西一样简单,但是仍然.. 。

回答 1 投票 0

使用Python tesseract从PNG图像中提取文本

最近,我参加了一个项目。使用Python tesseract将扫描的PDF转换为可搜索的PDF /单词。经过几次尝试,我能够将扫描的PDF转换为PNG图像文件,然后,我... ...>

回答 1 投票 -1

收到类似ModuleNotFoundError的错误:没有名为'tesserocr'的模块

[当我尝试为OCR执行程序时,出现模块未找到错误。我正在将Anaconda与Jupyter笔记本一起使用。我已经安装了tesserocr并在conda控制台中将其激活,但是...

回答 1 投票 0

OCR的背景图像清洁

通过tesseract-OCR,我试图从以下带有红色背景的图像中提取文本。由于存在垂直线,我在框B和D中提取文本时遇到问题。我该如何...

回答 1 投票 1

Python-OCR的背景图像清理

通过tesseract-OCR,我试图从以下带有红色背景的图像中提取文本。由于存在垂直线,我在框B和D中提取文本时遇到问题。我该如何...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.