ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

将图像上的标题(文本)裁剪到特定边框(按颜色)

如何沿着下部红色背景的边框从图像中剪切标题(示例如下)?我正在计划一个批处理过程,即使用数百张具有不同标题的图像(都带有

回答 1 投票 0

确定的 OCR 质量

我有一个低质量的英文PDF文件,没有图像,没有表格,单列,完全黑白 - 甚至没有灰色。我使用了 ABBYY FineReader,它检测到的文本很好,我可以海...

回答 1 投票 0

如何提高PaddleOCR性能,有时无法检测单词之间的空格

我正在使用 paddleOCR 从日常使用的项目中提取数据,它在大多数情况下工作正常,但有时它会将两个或多个单词混合为一个单词,它不会占用空间......

回答 2 投票 0

获取 UnboundLocalError:在将 craft-text- detector 应用于 python 中的图像时,在赋值之前引用局部变量“img”

我正在尝试使用Python中的craft-text- detector获取图像作物。 使用 craft-text- detector==0.4.3 torch==1.11.0 torchvision==0.12.0 numpy==1.23.0 代码: # 导入工艺函数 来自 craft_text_de...

回答 1 投票 0

Python 的 Tesseract - 奇怪的 OCR 结果 - 转换数字行但无法转换每个单独的数字

在 python 中使用 Tesseract 并得到不一致的 OCR 结果 - 它可以正确转换数字行,但无法转换每个单独的数字。 例如,对于此图像 1 Tesseract 给出了正确的 r...

回答 1 投票 0

如何链接 Kotlin 和 Python 项目?

我有一个带有 OCR、图像处理步骤的 python 项目。我想通过将我用 Kotlin 项目拍摄的照片发送到这个 Python 文件来进行 OCR 操作。我如何连接这两个项目? C...

回答 1 投票 0

在 VSTO Excel Addin 中调用 Azure 文档智能 API

这可能是由于我对 VSTO 插件缺乏了解,但我根本无法从应用程序内调用 Azure 文档智能来工作。我做了一个常规的控制台应用程序,ju...

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体,Beaufort for LOL。 为此,我遵循了使用 QT-Box 编辑器的视频中的教程:https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

回答 1 投票 0

Pytesseract 无法正确识别板

我正在使用 pytesseract 尝试识别车牌,但它没有返回正确的结果。 这是我的代码 文本 = pytesseract.image_to_string(cropped_License_Plate, lang='eng', config='--psm ...

回答 1 投票 0

用于信息提取的 PDF 到 HTML 和 OCR 解决方案

我正在寻找云端或 SDK 格式的 PDF 到 HTML 和 OCR 服务的解决方案。经过搜索,我发现互联网上有很多服务。我尝试了一些...

回答 1 投票 0

用于包含数学和表格的 pdf 的最佳 OCR 工具

我开始开发一款专为数学考试量身定制的 examMaker 应用程序,此过程的关键部分涉及将大量数学考试从 PDF 转换为 LaTeX 格式。在尝试了各种...

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器,它是一个 OCR 代码。 我使用以下代码来获取单词: 导入超正方体 API =

回答 9 投票 0

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本?

首先,我想使用鼠标事件裁剪图像,然后打印裁剪图像内的文本。我尝试了 OCR 脚本,但所有这些脚本都不适用于下面所附的图像。我认为原因是...

回答 2 投票 0

使用 Keras OCR 返回字符串

我正在使用 Keras OCR 的示例来检测图像中的文本。使用官方文档中提供的示例代码,我使用预训练的权重获得了很好的准确性。 我打算使用...

回答 2 投票 0

类型错误:'<' not supported between instances of 'tuple' and 'float'

从PIL导入Image、ImageDraw、ImageFont 图像 = Image.open(img_path).convert('RGB') box = [结果中的行[0]] txts = [结果中的行[1][0]

回答 1 投票 0

导入错误:无法从“layoutlm

我正在尝试保存 LayoutLM 模型的预测。 论文 - https://arxiv.org/abs/1912.13318 笔记本 - https://www.kaggle.com/code/iamarjunchandra/layoutlm-document-sequence-labeling-model/

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件? 目前我只知道如何使用可执行文件来做到这一点。

回答 5 投票 0

寻求 ML 模型建议以增强损坏文本图像的 OCR 功能

我正在开展一个项目,需要对基于文本的图像执行光学字符识别(OCR)。然而,这些图像以各种方式被损坏(例如模糊、扭曲、低分辨率......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.