ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

提取(用于OCR)硬编码视频字幕

YouTube 上的许多韩国视频都有硬编码字幕(例如 https://youtu.be/Zyd6hAvxTnc)。 期望的最终结果是文本格式的 OCR 字幕。 我有一个半手动过程

回答 1 投票 0

预处理褪色图像

我正在尝试预处理稍微倾斜和褪色的收据图像。 我找到了调整照片位置的代码。但我不知道如何使文本清晰。 原来的 导入CV2 ...

回答 1 投票 0

在Python中提取多列(?)PDF

我正在尝试编写一个程序,将多页 PDF 批量转换为纯文本(想想很多页教科书)。如果我通过 PyPDF2 运行它,我会发现以下问题:如果特定页面有 2 列,它会...

回答 1 投票 0

如何使用 ocr 引擎解析 ozf 文件中的文本

我正在创建一个应用程序,它从学校菜单中获取信息。为此,我使用 LEADtools ocr 演示来对一周中的每一天进行分区。我已经下载了带有各自区域的文件作为...

回答 1 投票 0

使用 pytesseract 提高文本提取的准确性

我正在开发一个从图像中提取文本进行翻译的项目,但 pytessearct 库无法检测到所有单词。我需要 100% 的检测准确度。如何让我...

回答 3 投票 0

来自 Google Vision API 的 OCR 置信度评分

我正在使用 Google Vision OCR 从 python 中的图像中提取文本。 使用以下代码片段。 然而,置信度分数始终显示 0.0,这绝对是不正确的。 如何提取...

回答 3 投票 0

WinError 5:访问被拒绝 PyTesseract

我知道这个问题已经在这个网站上得到了回答,但是,我在互联网上查找的解决方案似乎都不起作用。这是我尝试过的: 授予我的 python 文件所有权限 Ch...

回答 7 投票 0

使用 OCR 和 Python 提取阿拉伯数字

我有一个图像,我需要从中提取这个数字(真值标签):1٤٤2٦7。我正在使用 EasyOCR: results = reader.readtext(image,paragraph = True,text_threshold =0.15,low_text=0.2,add_margin...

回答 1 投票 0

从图像中提取文本

我正在研究从图像中提取文本。 最初图像是彩色的,文本是白色的,在进一步处理图像时,文本显示为黑色,其他像素显示为白色(...

回答 3 投票 0

AWS texttract 以键值对形式提取 pdf 数据

我想使用aws s3存储桶和python django中的texttract从下面的pdf中以键值对形式提取数据,请在此处输入图像描述 这是我当前的 python 代码和输出 定义

回答 1 投票 0

AWS Textract OCR 将 PDF 读取为单行,而不是保留换行符

您好,我是 AWS Textract 新手。 我正在使用 Amazon Textract 从 PDF 文件中提取文本。但是,输出不会保留原始 PDF 中的换行符。 例如,在 PDF 中有...

回答 1 投票 0

使用 VNRecognizeTextRequest 进行垂直文本识别

在对 iOS 应用程序(用 Swift 5 编写)进行一些测试期间,我发现使用 VNRecognizeTextRequest 识别垂直书写的文本存在问题。我还检查了可修改的参数...

回答 1 投票 0

AI图像识别(音乐棒)

我心里有一个小项目,正在寻找一些关于我可能采取的方法的建议。 我想构建一个简单的应用程序: 分析一张吉他谱/音乐 可以检测到此范围内的条形 前...

回答 1 投票 0

从堆叠的记录/书脊图像中提取文本

我正在尝试从一张黑胶唱片书脊的照片中捕获文本 - 例如。我希望最终结果是一个文本字符串数组,其中每个字符串代表图像中的一条记录...

回答 1 投票 0

如何查找 Oracle Text 中尚未索引的文档

环境:Oracle 19c 我们有一个系统,它使用 Oracle Text (Oracle 19c) 来索引作为 BFile 存储在表中的 PDF 文件。我们使用 Adobe Acrobat 对 PDF 文件进行预处理以 OCR PDF...

回答 1 投票 0

如何从图像中删除文本(不是修复,只是文本上的纯色)

您好,有以下Python代码可以查找图像中的文本,并使用cv2.inpaint通过覆盖生成的背景来删除该文本,但我只想在文本上添加纯色...

回答 1 投票 0

自动裁剪图像并检测裁剪线

我正在做一个项目,这是一个Android应用程序,使用相机捕获门票的照片,并仅对其中的一部分进行OCR识别。我以前没有图像处理经验,...

回答 2 投票 0

Paddle OCR 在传递 pdf 文件进行文本检测时出现问题

您好,我在将 pdf 文件传递给 paddleocr 时遇到问题 我的代码是: !paddleocr --image_dir /content/SER-1678793239.pdf --use_angle_cls true --use_gpu false 我面临的问题是: 属性错误:'

回答 2 投票 0

使用 PHP 的 Microsoft OCR API

我对 PHP 相当陌生,我正在尝试使用 Microsoft OCR API。我已经有了我的密钥,并且它正在工作,正如我在这里测试的那样:https://brazilsouth.dev.cognitive.microsoft.com/docs/services/uni...

回答 1 投票 0

在python中自动找到一个矩形并裁剪图像到它

所以说我有很多与这些类似的图像: 我试图得到里面有数字的矩形,它是背景较浅的矩形,我也想去掉这些线条,但是

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.