python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

Tesseract和Tesseract有什么区别?

我在Windows 10中使用Python 3.6并且已经安装了Pytesseract但我在代码Tesserocr中找到了我无法安装的方式。有什么不同?我有Visual Studio社区2017 ...

回答 3 投票 2

AttributeError:模块'pytesseract'没有属性'image_to_string'

>导入图像>导入pytesseract为pya >> pya.tesseract_cmd = r'C:\ Users \ Euphz \ Documents \ Artworks \ PSD \说到Dogs \ 201710'> print(pya.image_to_string(image.open('doggieville .. ..

回答 2 投票 -1

如何在anaconda上安装tesseract for python

有谁知道如何在Anaconda上安装tesseract for python?我有一个Windows系统。 anaconda网站提供了linux系统的安装:conda install -c auto pytesseract会......

回答 3 投票 3

如何从包含表格数据的图像中提取数据?

我正在使用pytesseract,pillow,cv2对图像进行OCR并获取图像中的文本。由于我的输入是扫描的PDF文档,我首先将其转换为图像(JPEG)格式然后尝试...

回答 1 投票 0

Tesseract OCR的Opencv图像转换

我有以下Image想要提供给tesseract来检测文本:输入图像:我正在使用OTSU转换处理这个图像:代码如下:import cv2 import numpy as np ...

回答 3 投票 0

写入文本文件 - 'ascii'编解码器无法编码字符

我在将文本图像中的单词输出到.txt文件时遇到了一些麻烦。从PIL导入pytesseract导入Image,ImageEnhance,ImageFilter text = pytesseract.image_to_string(Image.open(“...

回答 2 投票 1

如何使用Tesseract capi获取多页TIFF的文本?

我正在使用来自Python的tesseract capi使用ctypes。除了多页TIFF之外,一切似乎都运行良好。我只从最后一页获得文本而不是多页TIFF中的所有文本。这个 ...

回答 1 投票 1

Tesseract OCR用于半导体晶圆ID检测(Python)

我试图通过在Python中使用Tesseract OCR来准备半导体晶圆ID,但它不是很成功,而且,-c tessedit_char_whitelist = 0123456789XL配置不起作用。读出芯片ID为:po4&...

回答 2 投票 0

是否可以在将图像传递给tesseract ocr模块之前检查图像的方向

对于我当前的ocr项目,我尝试使用tesserect使用python cover pytesseract将图像转换为文本文件。到目前为止,我只是将直接导向的图像传递到我的......

回答 2 投票 1

ModuleNotFoundError:没有名为'pytesseract'的模块

我在Windows 10上使用Anaconda Navigator 1.7.0,我创建了一个名为“venv”的虚拟环境,并在其中安装了Python版本3.5.2以及selenium,fuzzywuzzy和其他模块。 ...

回答 1 投票 3

在Ubuntu 15.x上安装python-tesseract

我在Ubuntu系统上安装python-tesseract时遇到问题。从14.04开始,我尝试了几个版本的32位Ubuntu系统,但我什么都没得到。我下载了python-tesseract_0 ....

回答 2 投票 -1

二进制图像上的OCR

我有一个二进制文本图像像这样一个黑色的白色文本 - 猫我想对像这样的图像执行OCR。它们只包含一个单词。我曾尝试过tesseract和谷歌云视觉,但......

回答 1 投票 0

我们可以使用CNN / LSTM在图像中找到所需的字符串吗?或者我们是否需要在使用CNN / LSTM提取文本后应用NLP。请有人澄清一下吗?

我在图像上构建解析器算法。 tesseract没有给出准确性。所以我想构建一个基于CNN + LSTM的模型进行图像到文本的转换。我的方法是正确的吗?我们可以提取......

回答 1 投票 0

pytesseract临时输出文件“没有这样的文件或目录”错误

我正在使用pytesseract行:text = image_to_string(temp_test_file,lang ='eng',boxes = False,config =' - c ...

回答 2 投票 1

将PDF转换为图像但放大后

此链接显示如何将pdfs转换为图像。有没有办法在转换为图像之前缩放我的PDF文件?在我的项目中,我将pdf转换为png,然后使用Python-tesseract库...

回答 1 投票 5

ImportError:无法使用pytesseract导入名称'image_to_data'

我正在使用OCR从image.image_to_string提取文本及其坐标(边界框)工作正常,但image_to_data输出错误,它是提取...

回答 1 投票 0

Tesseract - 将多个单词图像格式化为OCR的一个图像的最佳方法

我有一系列图像,每个图像都包含一个单词。而不是分别在所有图像上运行pytesseract OCR(工作正常),我想将图像编译成一个大图像,并...

回答 1 投票 2

Pytesseract太慢了。如何让它更快地处理图像?

我在下面的代码中使用pytesseract:def fnd():对于列表中的fname:x =无x = np.array([np.array(PIL.Image.open(fname))])为x打印x.size在x:...

回答 1 投票 1

检测带有OpenCV框的手写字符

我正在尝试阅读一个盒装输入的手写表单。我在图像上运行了tesseract但得到了奇怪的结果。根据我的理解,我认为最好的办法是检测边界......

回答 2 投票 2

如何为Tesseract 4.1.0创建Traineddata文件

我想要识别号牌的字符。如何在ubuntu 16.04中为各自的车牌训练tesseract-ocr。因为我不熟悉培训。请帮我创建一个'...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.