python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

OCR 和 pytesseract 检测图像中的数字

当前出价.png: 我试图检测该图像中的数字,它给了我字母或错误的数字。 这是我的图像,我正在尝试检测我尝试过大量灰度内容的数量...

回答 1 投票 0

Appium:使用 pytesseract 而不是定位器来识别 iOS 元素

下面是我们测试中的应用程序的快照。 React Native 中的 iOS 应用程序。层次太深了。 我们已经使用 snapshotmaxdepth - 60 作为功能之一。 其他功能包括...

回答 1 投票 0

PyTesseract OCR 的乱码输出

pytesseract.pytesseract.tesseract_cmd =“C:\Program Files (x86)\Tesseract-OCR\tesseract.exe” def extract_text(图像): 灰色 = image.convert('L') 增强器 = ImageEnhance.Contrast...

回答 1 投票 0

在 Windows 10 上安装 Tesseract OCR 时,Tesseract 不在您的路径中

我尝试在 Windows 10 系统上安装 Tesseract OCR,但安装后遇到错误“Tesseract 不在您的 PATH 中”。 我按照以下步骤安装了 Tess...

回答 1 投票 0

在Python中从图像读取TD1机读区

我正在开发一个程序,该程序应该检测MRZ(TD1)文本并将其作为字符串从阿联酋卡背面返回。我使用 Python 和“mrz_reader”包对护照(TD3)做了同样的事情...

回答 2 投票 0

改善存在覆盖线的文本识别

这是一个简单的Python 3光学字符识别(OCR)程序来获取字符串,我已经在这里上传了目标gif文件,请下载并保存为/tmp/target.gif。 尝试: 来自 PIL

回答 2 投票 0

使用Python突出显示图像中的特定文本

我想在网站截图中突出显示特定的单词/句子。 截取屏幕截图后,我使用 pytesseract 和 cv2 提取文本。这很有效,我可以获取有关...的文本和数据

回答 2 投票 0

使用 anonympy 自动匿名 PDF

我正在尝试使用 anonympy (https://github.com/ArtLabss/open-data-anonymizer) 对 PDF 进行匿名化。不幸的是,这个包似乎不太受欢迎,也没有很好的文档记录,所以没有太多......

回答 1 投票 0

如何获取从 pytesseract.image_to_boxes 中提取文本的置信度

我正在使用 pytesseract.image_to_boxes 因为我需要从文本中提取所有详细信息,但我需要在字符级别。我获得了字符的文本、左、下、右、上和页。布...

回答 1 投票 0

使用Python解决验证码

我正在尝试从下面的验证码图像中提取值,但我的代码没有给我输出。我得到空字符串作为输出。 我尝试过使用下面的代码。虽然它与 b 一起工作得很好...

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体,Beaufort for LOL。 为此,我遵循了使用 QT-Box 编辑器的视频中的教程:https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

回答 1 投票 0

Pytesseract 无法正确识别板

我正在使用 pytesseract 尝试识别车牌,但它没有返回正确的结果。 这是我的代码 文本 = pytesseract.image_to_string(cropped_License_Plate, lang='eng', config='--psm ...

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器,它是一个 OCR 代码。 我使用以下代码来获取单词: 导入超正方体 API =

回答 9 投票 0

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本?

首先,我想使用鼠标事件裁剪图像,然后打印裁剪图像内的文本。我尝试了 OCR 脚本,但所有这些脚本都不适用于下面所附的图像。我认为原因是...

回答 2 投票 0

Pytesseract 返回边界框内的文本

我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用python从pdf中检测语言/脚本

我正在尝试创建一个python脚本来在pytesseract的帮助下检测尚未OCRed pdf中的语言/脚本,然后通过传递正确的检测到的语言来进行“真正的”ocr...

回答 1 投票 0

具有不同背景颜色和低对比度的 OCR?

我正在尝试使用 pytesseract 将图像转换为文本。它对于白色背景和黑色文本的图像效果很好,但对于对比度较低和颜色变化的图像则失败。 我已经尝试过...

回答 1 投票 0

Tesseract.js OCR 如何正确设置页面分割模式(PSM、pageseg)以检测图像中的单个数字

我一直在使用tesseract读取各种数字(最多99,999.9),格式如下: OCR 失败的图像示例: 似乎 80% 的时间都能正确读取,但我需要 95% 的时间...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.