python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

在Python中从图像读取TD1机读区

我正在开发一个程序,该程序应该检测MRZ(TD1)文本并将其作为字符串从阿联酋卡背面返回。我使用 Python 和“mrz_reader”包对护照(TD3)做了同样的事情...

回答 2 投票 0

改善存在覆盖线的文本识别

这是一个简单的Python 3光学字符识别(OCR)程序来获取字符串,我已经在这里上传了目标gif文件,请下载并保存为/tmp/target.gif。 尝试: 来自 PIL

回答 2 投票 0

使用Python突出显示图像中的特定文本

我想在网站截图中突出显示特定的单词/句子。 截取屏幕截图后,我使用 pytesseract 和 cv2 提取文本。这很有效,我可以获取有关...的文本和数据

回答 2 投票 0

使用 anonympy 自动匿名 PDF

我正在尝试使用 anonympy (https://github.com/ArtLabss/open-data-anonymizer) 对 PDF 进行匿名化。不幸的是,这个包似乎不太受欢迎,也没有很好的文档记录,所以没有太多......

回答 1 投票 0

如何获取从 pytesseract.image_to_boxes 中提取文本的置信度

我正在使用 pytesseract.image_to_boxes 因为我需要从文本中提取所有详细信息,但我需要在字符级别。我获得了字符的文本、左、下、右、上和页。布...

回答 1 投票 0

使用Python解决验证码

我正在尝试从下面的验证码图像中提取值,但我的代码没有给我输出。我得到空字符串作为输出。 我尝试过使用下面的代码。虽然它与 b 一起工作得很好...

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体,Beaufort for LOL。 为此,我遵循了使用 QT-Box 编辑器的视频中的教程:https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

回答 1 投票 0

Pytesseract 无法正确识别板

我正在使用 pytesseract 尝试识别车牌,但它没有返回正确的结果。 这是我的代码 文本 = pytesseract.image_to_string(cropped_License_Plate, lang='eng', config='--psm ...

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器,它是一个 OCR 代码。 我使用以下代码来获取单词: 导入超正方体 API =

回答 9 投票 0

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本?

首先,我想使用鼠标事件裁剪图像,然后打印裁剪图像内的文本。我尝试了 OCR 脚本,但所有这些脚本都不适用于下面所附的图像。我认为原因是...

回答 2 投票 0

Pytesseract 返回边界框内的文本

我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用python从pdf中检测语言/脚本

我正在尝试创建一个python脚本来在pytesseract的帮助下检测尚未OCRed pdf中的语言/脚本,然后通过传递正确的检测到的语言来进行“真正的”ocr...

回答 1 投票 0

具有不同背景颜色和低对比度的 OCR?

我正在尝试使用 pytesseract 将图像转换为文本。它对于白色背景和黑色文本的图像效果很好,但对于对比度较低和颜色变化的图像则失败。 我已经尝试过...

回答 1 投票 0

Tesseract.js OCR 如何正确设置页面分割模式(PSM、pageseg)以检测图像中的单个数字

我一直在使用tesseract读取各种数字(最多99,999.9),格式如下: OCR 失败的图像示例: 似乎 80% 的时间都能正确读取,但我需要 95% 的时间...

回答 1 投票 0

如何使用 pytesseract 修复这些错误?

我正在尝试创建一个非常简单的程序,可以扫描屏幕的特定部分并打印找到的任何文本。由于某种原因,我遇到了一系列我找不到的错误

回答 1 投票 0

带有 Chaquopy 的 Android Studio:Tesseract 未安装或不在路径中

我正在尝试创建一个 OCR Android 应用程序。我已经有一个 python 脚本,我正在尝试用 chaquopy 来实现它。我在 build.gradle 中做了必要的配置。 Python{ 版本...

回答 1 投票 0

如何在 Android 上将 Pytesseract 用于 Kivy 应用程序?

所以我计划将 Tesseract 用于 Kivy 应用程序。但我不确定它是否适用于 Android,因为在 Tesseract 中你必须提供可执行文件的路径。我在这里读过一篇关于此的文章,...

回答 1 投票 0

识别图像上的错误文字

这是我的图片: 这是我的代码: 导入CV2 导入 pytesseract pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR esseract" img = cv2.imread(r"C:\Users\xxx\

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.