python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

号码和位置识别

帮忙处理这张图片: 我想从该图像中提取数字(以及数字的相对位置)。 我将 pytesseract 与 Python 一起使用,但无法获得任何结果。 我不知道该怎么办

回答 1 投票 0

使用tesseract从低质量的gif文件中获取文本

导入pytesseract 导入请求 从 io 导入 BytesIO 从 PIL 导入 Image、ImageOps 图片网址 = 'gif' def optimize_and_ocr_from_url(image_url, tesseract_config="--psm 6"): #

回答 1 投票 0

Tesseract 4.1.1 错误 eng.traineddata 在 google colab 中找不到

我正在尝试在google colab中安装tesseract 4.1.1。我已经安装了 tesseract,我可以使用 !tesseract --version 检查版本。之后我下载了 eng.traineddata 和 org.trained...

回答 2 投票 0

修复 Pytesseract OCR 输出旋转的问题

我正在尝试像这样 OCR 路径点的图像,并且我希望输出与下图完全相同: 这是我的代码: 将 pytesseract 导入为 tess 从 PIL 导入图像 重要...

回答 1 投票 0

Pytesseract OCR 检测路径点的小数

我正在尝试像这样 OCR 路径点的图像,并且我希望输出与图像完全相同。 在此输入图像描述 这是我的代码: 将 pytesseract 导入为 tess 来自 PIL 我...

回答 1 投票 0

如何在不损失图像质量的情况下去除图像边框?

我有一个图像,其中包含列标题边框,但没有数据边框,现在我想从图像中删除边框或线条而不损失其质量。 这是图像 这是...

回答 1 投票 0

无法在AWS Lambda上安装Tesseract 5.0版本

我想在我的 AWS Lambda 函数上运行 Tesseract 4.0 或 Tesseract 5.0。所以我的 docker 文件就像这样- 来自 public.ecr.aws/lambda/python:3.8 运行 mkdir 应用程序 # 复制函数代码 复制/${

回答 2 投票 0

以Python列表格式提取图像中的删除线文本

我的任务是从图像中识别并提取带有删除线符号的文本。我只想选择具有此符号的单词并将每个实例放入列表中。 图像包含 Strikethr...

回答 1 投票 0

使用 pytesseract 从图像中提取字符串

我是 OCR 操作和从图像中提取数据的新手。搜索解决方案后,我确实找到了一些代码,但它不适用于我的用例,它没有正确提取所有字符,位于

回答 1 投票 0

PyTesseract 无法识别绿色背景上的文本

我在预处理时一直在摆弄图像,但超立方体无法检测液晶屏幕上的文本。它确实在它周围创建了一个边界框,我猜这意味着它找到了

回答 1 投票 0

KerasOCR、EasyOCR、Pytesseract 无法识别简单数字

我试图在我的单个字符图像上运行 OCR,所有图像都是数字。我尝试在图像上运行 EasyOCR、Keras-OCR 和 Pytesseract,但没有返回正确的输出。我什至尝试过 MNIST,但是...

回答 1 投票 0

Python-tesseract OCR 问题:分词不正确

您好 Stack Overflow 社区, 当我尝试识别“ADRIEL”这个词时,我遇到了 Python-tesseract OCR 工具的问题。 OCR 输出错误地将其分割成两个单独的...

回答 1 投票 0

当图像已经正面朝上时,将图像旋转 90° 4 次的 OCR 代码会失败

我已经使用 PyTesseract 编写了 Python 代码,从可能旋转的图像中提取文本。它通过尝试从基本图像中获取文本,然后将其旋转 90 度三次,然后

回答 1 投票 0

将图像旋转 90 度 4 次并获得最清晰文本的 Python 代码不起作用

我已经使用 PyTesseract 编写了 Python 代码,从可能旋转的图像中提取文本。它通过从基本图像中获取文本,然后将其旋转 90 度三次并进行比较来实现此目的...

回答 1 投票 0

Pytesseract OSError:[WinError 740] 请求的操作需要提升

我正在按照本教程使用 pytesseract python 库识别 .png 图像中的文本,但出现此错误: -------------------------------------------------- ------------------------

回答 1 投票 0

如何使用 pytesseract 用简单的数字读取该图像中的文本?

image_processed 变量是附加的图像。 custom_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist= 0123456789/' 结果 = pytesseract.image_to_string(image_processed, lang='eng', ...

回答 1 投票 0

如何将扫描的 PDF 转换为 DOCX

嘿,我遇到了一个问题。我想将扫描的 PDF 转换为 docx 文档,同时保留格式。 如何以保留其中的图表和表格的方式解析布局解析器......

回答 1 投票 0

Tesseract OSD 脚本检测输出

我正在尝试在多语言项目上使用 Tesseract,因此我尝试使用 OSD 功能来提取脚本类型,然后将其作为 Tesseract 的 OCR 文本检测的语言的输入。 .

回答 1 投票 0

将.traineddata与passportEye Python结合使用用于MRZ

我正在尝试使用tesseract ocr和passportEye提高护照MRZ读取的准确性我发现很少有包含“*.traineddata”的github存储库,它说将其移至tessera...

回答 2 投票 0

如何将 OCR 从 PyTesseract 更改为 AzureFormRecognizer

我目前正在尝试在 GitHub 上找到的代码,使用 OCR 从扫描文本中提取突出显示的文本。我想尝试更改所使用的 OCR。目前,该代码使用 PyTesseract。我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.