ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

为什么 Tesseract 在干净的数字数据上表现不佳?

我正在开发一个项目,用超立方体从多张图像中识别数字时钟时间。 不幸的是,大多数时候它无法识别任何东西并给我一个空的结果。 我的泰瑟...

回答 1 投票 0

Jira中的OCR,如何从截图中获取文本信息

我们使用 jira 作为我们的 ITSM 工具。通常,我们的最终用户会在票证中发送屏幕主机,我们需要手动重新输入其中的文本(例外、网址...)。如果我们能自动就好了

回答 1 投票 0

OCR提取(名片)

我是 Flutter 新手,正在尝试构建一个基于 Flutter 的应用程序,该应用程序扫描名片然后提取信息,我已经完成了一半,但有时提取不正确,有时......

回答 1 投票 0

OCR/HTR 的最新技术水平?

我尝试过使用 Tesseract 在线 OCR 文本,结果相当令人满意,但我不能说我对此感到满意。 我想知道 OCR 和 HTR 中最先进的方法是什么?我有七...

回答 1 投票 0

如何使用OCR读取表单数据,然后将OCR读取的数据转换为结构化数据?

我对 ML 领域非常陌生。 我希望从客户填写的物理表格(地址变更表格)中读取数据,使用 OCR 读取此数据。 然后能够将数据转换为结构化 JSON ...

回答 1 投票 0

为 OCR 生成相似的单词

所以首先这是我第一次在这里提问,所以如果我犯了任何错误,请原谅我。 我的问题如下:我正在使用 python 对一堆图像进行排序。图像按...排序

回答 2 投票 0

确定图像上文本的角度

我想确定 PDF 文档中文本的倾斜角度(以便对齐该文档)。 我收到一份由人们扫描的 PDF 文档,因此,这......

回答 2 投票 0

如何在使用 Google 云视觉或文档 AI 的 OCR 工具时保持文本空间完整性?

我正在使用 Google Document AI 提供的 OCR 工具从图像中提取文本,如下所示: 我的目标是创建一个数据框,其中包含给定的所有指标,例如费率、RR、PR...

回答 1 投票 0

二值化图像并提取背景为黑色且要提取的文本为红色的文本?

我正在尝试使用内存中的 cv2 和 pytesseract 从屏幕截图中提取文本。 当文本为黑色背景上的白色时,它可以工作,但当文本为红色时,返回始终为空。 导入系统

回答 1 投票 0

Pytesseract 无法正确识别数字

我有这个函数可以从数独表中获取数字: def extract_sudoku(image_path): 图像 = cv2.imread(image_path) 灰色 = cv2.cvtColor(图像, cv2.COLOR_BGR2GRAY) 模糊= cv2。

回答 1 投票 0

Python - 解决基本的嘈杂验证码

我正在尝试解决有一点噪音的基本验证码,但事实证明这很困难。 这是其中一个验证码的示例图像: 这是我正在使用的代码: 导入CV2 来自

回答 1 投票 0

使用python从图像中读取阿拉伯语数据[关闭]

我有一个包含阿拉伯语单词和数字的图像,我如何从该图像读取数据并将其写入 Excel 工作表。我尝试使用 pytesseract python 但不起作用。 有人能帮我吗 ? 图像

回答 1 投票 0

我可以采取哪些图像预处理步骤来使该图像OCR可读?

我正在使用 tesseract ocr 从中提取文本。虽然它能够从其他类似图像中提取一些信息,尽管存在轻微的拼写错误,但它无法检测到其中的任何单词......

回答 1 投票 0

如何将多边形坐标转换为矩形(yolo格式)进行图像标注?

我正在尝试通过 OCR 读取水表读数,但是,我的第一步是找到 ROI。我从 Kaggle 找到了一个数据集,其中包含 ROI 的标记数据。但它们不是矩形,而是我...

回答 2 投票 0

通过 Google Cloud Vision api (TEXT_DETECTION) 获取正确的图像方向

我在 90 度旋转图像上尝试了 Google Cloud Vision api (TEXT_DETECTION)。它仍然可以正确返回识别的文本。 (见下图) 这意味着引擎甚至可以识别文本...

回答 8 投票 0

Tesseract OCR 无法读取红色背景上的两行文本

我在代码中遇到了 pytesseract 问题。我已尽力使代码尽可能易于阅读,但如果有任何不合理的地方,请告诉我。问题似乎...

回答 1 投票 0

OCR 机器学习模型训练

我有兴趣开发类似于 Microblink 的自定义 OCR 卡片扫描模型。该模型应具有以下特征: 火车卡扫描功能 从扫描的卡片中检测文本

回答 0 投票 0

如何对实时视频进行 OCR?

我是一家轻工制造公司的员工。我们生产的每个单元的底部都有一个 3D 打印的数字。该数字也存储在谷歌表格中,用于识别特征......

回答 0 投票 0

Flutter/Dart:从图像中提取数字(离线)

我有一张用户上传的图片,可以在此处输入图片描述来查看。我的目标是提取图像中存在的数字并稍后在应用程序中使用它。

回答 1 投票 0

复杂的Python OCR - 可能吗?

我的公司采用建筑规划,每个房间都有一个房间名称和编号。房间名称始终为粗体并带有下划线,房间号始终位于房间下方的矩形内...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.