ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本?

首先,我想使用鼠标事件裁剪图像,然后打印裁剪图像内的文本。我尝试了 OCR 脚本,但所有这些脚本都不适用于下面所附的图像。我认为原因是...

回答 2 投票 0

使用 Keras OCR 返回字符串

我正在使用 Keras OCR 的示例来检测图像中的文本。使用官方文档中提供的示例代码,我使用预训练的权重获得了很好的准确性。 我打算使用...

回答 2 投票 0

类型错误:'<' not supported between instances of 'tuple' and 'float'

从PIL导入Image、ImageDraw、ImageFont 图像 = Image.open(img_path).convert('RGB') box = [结果中的行[0]] txts = [结果中的行[1][0]

回答 1 投票 0

导入错误:无法从“layoutlm

我正在尝试保存 LayoutLM 模型的预测。 论文 - https://arxiv.org/abs/1912.13318 笔记本 - https://www.kaggle.com/code/iamarjunchandra/layoutlm-document-sequence-labeling-model/

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件? 目前我只知道如何使用可执行文件来做到这一点。

回答 5 投票 0

寻求 ML 模型建议以增强损坏文本图像的 OCR 功能

我正在开展一个项目,需要对基于文本的图像执行光学字符识别(OCR)。然而,这些图像以各种方式被损坏(例如模糊、扭曲、低分辨率......

回答 2 投票 0

如何训练 Tesseract 5 以识别旧扫描书籍中的阿姆哈拉语文本

背景 我正在尝试在用阿姆哈拉语(使用埃塞俄比亚文字)编写的扫描旧书上使用 tesseract 5.3.3。 tesseract 的 amh.traineddata 的主要缺点 埃塞俄比亚语类型的差异

回答 1 投票 0

我们是否能够使用bus64或图像链接将OCR与Microsoft Power Automate集成?

我们希望人们在 Microsoft Power Automate 中进行 OCR,这确实发生了,但我们希望以动态的方式呈现这一点。 我们用它来识别图像或 PDF 文档中的文本,并且工作正常......

回答 1 投票 0

从带图纸的专利中提取可编辑文本

我有一堆专利的扫描图像,我需要以某种方式将其转换为某种可编辑的形式(最好是 docx)。以下是一页的示例: 我使用 tesseract 成功提取了文本...

回答 1 投票 0

如何在 OCR 中反转地图的色调?

我有一张部分美国地图,有不同深浅的蓝色。 我正在研究如何: 计算并对应地图中不同深浅的蓝色(例如,1 为最浅的蓝色,10 为最暗(如果有的话)...

回答 1 投票 0

使用python从pdf中检测语言/脚本

我正在尝试创建一个python脚本来在pytesseract的帮助下检测尚未OCRed pdf中的语言/脚本,然后通过传递正确的检测到的语言来进行“真正的”ocr...

回答 1 投票 0

R/Python:将 PDF 转换为表格

我的计算机上保存有一个 PDF 图像文件(例如“p1.pdf” - 这是原始文档的扫描副本) - 该文件看起来像这样(我添加了红线以显示

回答 2 投票 0

MediaProjection 的 CPU 使用率过高,留给 OCR 的 CPU 使用率却很低?

我在Android上使用两种不同的方法截取屏幕截图: 通过运行 /system/bin/screencap -p $path。 使用 MediaProjection API。 即使是完全相同的屏幕,执行 OCR 时...

回答 1 投票 0

Tesseract.js OCR 如何正确设置页面分割模式(PSM、pageseg)以检测图像中的单个数字

我一直在使用tesseract读取各种数字(最多99,999.9),格式如下: OCR 失败的图像示例: 似乎 80% 的时间都能正确读取,但我需要 95% 的时间...

回答 1 投票 0

如何从图像中提取文本数据并将其构建到 Excel 表格中

我正在提取 JSON 数据,它提供以下结果。该数据包括从图片中检索到的文本的坐标。有没有办法识别表格并将数据存储在 Excel 中...

回答 1 投票 0

有没有任何OCR或技术可以识别/识别以pdf文档形式打印的单选按钮?

我有一个 pdf 文档,其中包含无线电响应(如所附屏幕截图)。我只想通过 python 或任何 OCR 技术提取所选响应。有什么办法可以做到吗? (https://i.stack。

回答 1 投票 0

使用 OCR Mobile Vision 从身份证中提取姓名

我可以使用 Mobile Vision API 文本识别从身份证中获取所有文本,但我想从文本中提取特定信息,例如姓名。 一个输出块是这样的: 是...

回答 2 投票 0

初始化 Emgu.CV 时出现异常

嘿,这是我第一次使用这个网站,但我有一个问题。我看到了这个很棒的 YouTube 视频,内容是关于如何让 ocr 与 vb.net 一起工作。这里是网址: http://www.youtube.com/watch?v=Kjdu8SjEtG0 所以我

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.