python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

如何在python-tesseract中设置tessedit_write_images?

我正在尝试设置tessedit_write_images,但似乎无法做到,我在任何地方都看不到tessinput.tif:import tesseract api = tesseract.TessBaseAPI()api.Init(“。”, “ eng”,tesseract ....

回答 1 投票 8

如何利用Pytesseract文本识别提高OCR?

嗨,我希望通过pytesseract改善我的数字识别性能。我拍摄原始图像,并将其分成如下所示:大小可以变化。为此,我应用了一些前置...

回答 1 投票 3

在不破坏原始文本的情况下消除背景文本的干扰?

我有这张图片,我需要消除背景中的噪音。背景中的圆形设计实际上是由“史诗”一词组成的,在OCR中,它与我的原始文字混合在一起。怎么做...

回答 1 投票 0

在终端中找不到Tesseract

我对tesseract有问题(我在Pycharm上工作)。当我运行脚本时,一切正常。但是,当我定义一个方法并在终端中运行它时,会引发一个错误:TesseractNotFoundError:...

回答 1 投票 0

NameError:未定义名称'pytesseract'

Pytesseract无法识别。我已经尝试了在线记录的所有修复程序,包括将Tesseract-OCR添加到我的Path变量中,并结合了pytesseract.pytesseract.tesseract_cmd = r'C:\ Program ...

回答 1 投票 1

无法在python中使用pytesseract从tif图像中提取文本

我无法在python中使用pytesseract和PIL从.tif图像文件中提取文本。对于.png,.jpg图像文件,它工作得很好,仅在.tif图像文件中出现错误。我正在使用Python 3.7.1 ...

回答 1 投票 1

在python环境中运行Tesseract或替代OCR模块,而无需下载.exe文件

我正在寻找一种OCR实现,最好是在Python中,它能够从扫描的pdf(印刷的机器书面文本)中提取文本。但是,由于公司政策和安全原因...

回答 1 投票 0

pytesseract.pytesseract.TesseractError:(3221225477,'')*在Windows Server上]] << [

解决方案正在安装较旧的tesseract版本,该版本不是具有管理员权限的Alpha版本。

回答 1 投票 1

将pytesseract用于OCR时出现缓存错误

我正在尝试使用pytesseract OCR从目录中的所有PDF中提取文本,但是我收到一条错误消息,指出我的设备空间不足。我想删除每个图像...

回答 1 投票 0

为什么pytesseract无法识别此图像?

我正在尝试使用tesseract识别python中的单个数字。我的代码是这样的:从PIL导入numpy作为np从PIL导入图像从ImageIL导入pytesseract导入cv2 def def((...

回答 1 投票 0

使用Pytesseract,如何从OCR获得单词坐标作为输出?

使用Pytesseract如何从OCR获得单词坐标作为输出?从pytesseract导入pytesseract导入输出输出cv2 img = cv2.imread('C:/Users/temp/Desktop/Invoice.jpg')d = ...

回答 1 投票 0

是否有任何库提供准确的单词坐标作为输出。正在研究一个项目以对发票进行OCR,并获得准确的单词坐标

使用Python,Pytesseract,我们如何获得单词坐标作为输出。从pytesseract导入pytesseract导入输出输出cv2 img = cv2.imread('C:/Users/temp/Desktop/Invoice.jpg')d = ...

回答 1 投票 0

使用pytesseract执行OCR时出错

我想使用pytesseract。这是我的代码。从pdf2image导入pytesseract导入convert_from_path PDF_file ='file.pdf'text =''页面= convert_from_path(PDF_file,500)pageText = str((((...

回答 1 投票 0

我如何将RegEx模式传递给Pytesseract?

似乎有两种方法可以解决此问题,但似乎没有一种可行。首先,您可以传递tessedit_char_whitelist,但这似乎仅适用于字符,而不适用于模式:import pytesseract pytesseract ....

回答 1 投票 0

“不支持的图像对象,使用Tesseract

我正在使用Tesseract和Python从图像中构建字符标识符。这是我的代码:从PIL导入图像以pyt格式导入pytesseract image_file ='location'im = Image.open(...

回答 2 投票 0

使用Tesseract的类型错误

[我正在使用tesseract和python从图像中构建字符标识符,这是我从PIL导入的代码。图像导入pytesseract为pyt。 [

回答 1 投票 0

Python-图像以五边形pytesseract包围的文本

我正在尝试使用python从EPC证书准备能源效率等级。通常,EPC证书采用PDF格式。我已经将PDF转换为图像,并使用pytesseract来获取文本...

回答 1 投票 0

OCR使用Tesseract简单任务失败

我正在扫描的文本页面中进行文本识别,最近开始尝试Tesseract。我意识到有时它在执行某些任务时会遇到困难,因此我在一个将要拥有...

回答 1 投票 0

如何提高OCR准确性?

我有2张图片,如下所示。 tesseract完美地读取了A.png,但是即使B.png与A.png相似,B.png的准确性也非常差。如何提高准确性?我不知道...

回答 1 投票 2

不支持TSV输出。 Tesseract> = 3.05必需

我对tesseract版本有问题。错误日志:提高TSVNotSupported()pytesseract.pytesseract.TSVNotSupported:不支持TSV输出。需要Tesseract> = 3.05如何安装tesseract ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.