ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何通过Python客户端使用Document AI本地处理一批文件?

我正在尝试使用Python控制台使用文档OCR处理器在本地处理大量pdf文档(本机和扫描的)以提取文本和一些元数据。文件是

回答 1 投票 0

Pytesseract OSError:[WinError 740] 请求的操作需要提升

我正在按照本教程使用 pytesseract python 库识别 .png 图像中的文本,但出现此错误: -------------------------------------------------- ------------------------

回答 1 投票 0

对燃气表进行 OCR

我想在燃气表上执行 OCR,以便它可以读取值。我想要执行 OCR 的仪表示例: 在这种情况下,OCR 应返回 25539144。 正如你所看到的,有一点问题......

回答 2 投票 0

如何使用 pytesseract 用简单的数字读取该图像中的文本?

image_processed 变量是附加的图像。 custom_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist= 0123456789/' 结果 = pytesseract.image_to_string(image_processed, lang='eng', ...

回答 1 投票 0

OCR iOS/Android 消息应用程序屏幕截图

我有一个项目,需要将消息应用程序的屏幕截图转换为机器可读的格式(可能是 JSON)。我问你是否可以为我的

回答 1 投票 0

R 中 .png 的历史 OCR

我正在尝试 OCR 这个 .png 数据,但我在将数据拆分为列时遇到问题。特别是在怀俄明州生产数据中,我想将租赁、公司和县分开。这我...

r ocr
回答 1 投票 0

我可以使用 R 中的 tesseract ocr 包从该图像中提取某些单词吗?

我尝试使用R中的ocr tesseract包从png图像中提取文本(如下) 文本大部分是西班牙语。这是我的代码: 库(超正方体) #tesseract_download("spa") #下载...

回答 1 投票 0

使用 R 进行 OCR

我一直在尝试在R中进行OCR(读取PDF数据,其中数据为扫描图像)。一直在阅读有关此内容@ http://electricarchaeology.ca/2014/07/15/doing-ocr-within-r/ 这是一个非常好的...

回答 3 投票 0

10瓶保龄球得分捕捉

我想使用 OCR 从投矛处的监视器捕获保龄球得分。我看了一下这个数独解算器,因为我认为它非常相似 - 数字和网格,对吗?很难找到...

回答 1 投票 0

是否可以删除 PDF 的图像并仅保留 OCR 文本?

我扫描了一本书并使用 ABBYYY 对它进行 OCR,但我真正关心的是 OCR 中的文本以及它是按页面组织的。有没有一个工具可以用来删除所有扫描的页面图像,但是

回答 1 投票 0

Tesseract OSD 脚本检测输出

我正在尝试在多语言项目上使用 Tesseract,因此我尝试使用 OSD 功能来提取脚本类型,然后将其作为 Tesseract 的 OCR 文本检测的语言的输入。 .

回答 1 投票 0

从表单中的图像中提取信息

我有一些表格,填写了姓名:某事姓氏:某事等等。所有页面的格式都相似。 我有这种形式的图像。首先我通过 tesseract(pyt...

回答 1 投票 0

使用python从Word文档中提取文本并存储在excel文件中

我有一个Word文档,它是用于我们更广泛的会议的标准模板。我的Word文档中有两列,第一列包含所有标题,第二列包含...

回答 1 投票 0

Tesseract OCR 无法正确分割线

对于我的应用程序,我需要使用 OCR 从发票中提取文本。为了实现这一目标,我将需要扫描的发票裁剪到各个列,并将这些裁剪后的图像放入超正方体中。为了...

回答 1 投票 0

如何将 OCR 从 PyTesseract 更改为 AzureFormRecognizer

我目前正在尝试在 GitHub 上找到的代码,使用 OCR 从扫描文本中提取突出显示的文本。我想尝试更改所使用的 OCR。目前,该代码使用 PyTesseract。我...

回答 1 投票 0

如何使用 Tesseract 获取具有宽类型收据的批次上的文本

我必须以各种角度、质量和语言(法语、英语和西班牙语)对批量收据/发票进行 OCR(有些是扫描的,有些不是) 我认为我做的脚本可以处理 30% o...

回答 1 投票 0

pytesseract | image_to_string 和 image_to_boxes 之间的区别

我正在使用 pytesseract 来执行 OCR。我的应用程序仅对具有特定字体的 PNG 执行 OCR,因此我正在将 tesseract 训练为该特定字体。 考虑以下测试...

回答 1 投票 0

Tesseract OCR - 将复选框识别为单词

对于一位客户,我想教 Tesseract 将复选框识别为单词。当 Tesseract 识别出空复选框时,它工作得很好。 该命令与本教程结合使用...

回答 2 投票 0

Tesseract 训练 - 读取部首码表时出错 data/langdata/radical-stroke.txt

我尝试根据波兰语言模型(pol)和我自己的“基本事实”文本在特定字体上训练 Tesseract OCR - 可能很重要,我生成的文本不包含...

回答 2 投票 0

AWS Textract 支持日语作为 OCR 语言吗?

我正在使用 AWS Textract 从上传到 S3 的表单中获取数据。我无法找到任何方法来对日语文档执行此操作。 通读 AWS 文档表明有...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.