ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何检测选中的复选框并从图像中提取与其关联的文本?

我有由表格图像组成的 PDF。我想在此图像上应用 OCR 和 OMR 来提取所需的数据。我想检测勾选的复选框并将相关数据提取到这些检查...

回答 1 投票 0

Char 的边界框顶点顺序

Google Vision API 文档指出,检测到的字符的顶点将始终保持相同的顺序: // 符号的边界框。 // 顶点的顺序是左上、上...

回答 3 投票 0

如何结合多个OCR工具的结果以获得更好的文本识别

想象一下,您有不同的 OCR 工具来从图像中读取文本,但没有一个工具可以为您提供 100% 准确的输出。然而,综合起来,结果可能非常接近真实情况——什么会......

回答 1 投票 0

Tesseract 4.1.1 错误 eng.traineddata 在 google colab 中找不到

我正在尝试在google colab中安装tesseract 4.1.1。我已经安装了 tesseract,我可以使用 !tesseract --version 检查版本。之后我下载了 eng.traineddata 和 org.trained...

回答 2 投票 0

如何提取图像中的表格

我想从图像中提取表格。这个Python模块https://pypi.org/project/ExtractTable/及其网站https://www.extracttable.com/pro.html做得很好,但他们有有限

回答 2 投票 0

修复 Pytesseract OCR 输出旋转的问题

我正在尝试像这样 OCR 路径点的图像,并且我希望输出与下图完全相同: 这是我的代码: 将 pytesseract 导入为 tess 从 PIL 导入图像 重要...

回答 1 投票 0

如何使用 Spire.PDF 或任何其他库将 pdf 文件读取为正确格式的文本文件?

如何使用 Spire.PDF 读取 pdf 文件并将内容保存到文本文件? 例如:这是一个 pdf 文件,这是该 pdf 中所需的文本文件 我尝试使用下面的代码来读取文件并

回答 4 投票 0

Pytesseract OCR 检测路径点的小数

我正在尝试像这样 OCR 路径点的图像,并且我希望输出与图像完全相同。 在此输入图像描述 这是我的代码: 将 pytesseract 导入为 tess 来自 PIL 我...

回答 1 投票 0

我有一组特定图像,我需要从中识别手写数字。问题是它们非常扭曲且嘈杂

我们需要识别数字的图像 现在,从该图像中可以看出,数字有时会被删除,有铅笔记号,其中一些甚至用铅笔/绿笔圈出。

回答 1 投票 0

Tesseract-OCR 的最佳分辨率[重复]

tesseract OCR 的最佳 tif 图像分辨率是多少? 我只是使用 Ghostscript 转换 OCR-PDF,分辨率 1200 可以更好地转换为文本

回答 1 投票 0

在Python中提取PDF文件的文本和表格

我正在寻找一种从 PDF 文件中提取文本和表格的解决方案。虽然某些软件包适合提取文本,但它们不足以提取表格。 一种解决方案是你...

回答 3 投票 0

如何在不损失图像质量的情况下去除图像边框?

我有一个图像,其中包含列标题边框,但没有数据边框,现在我想从图像中删除边框或线条而不损失其质量。 这是图像 这是...

回答 1 投票 0

如何识别图像中的字母? (OCR 之前)

我在网上能找到的都是关于OCR的,但我还没有做到这一点,我仍然需要识别字母在图像中的位置。

回答 2 投票 0

光学字符识别

大家好, 我正在尝试用 Java 创建一个程序,它可以读取屏幕上的数字,并且还可以识别屏幕上的图像。我想知道我怎样才能实现这一目标? 数字的字体...

回答 3 投票 0

无法在AWS Lambda上安装Tesseract 5.0版本

我想在我的 AWS Lambda 函数上运行 Tesseract 4.0 或 Tesseract 5.0。所以我的 docker 文件就像这样- 来自 public.ecr.aws/lambda/python:3.8 运行 mkdir 应用程序 # 复制函数代码 复制/${

回答 2 投票 0

如何识别需要OCR的PDF文件?

我有超过 30,000 个 pdf 文件。有些文件已经是 OCR,有些则不是。有没有办法找出哪些文件已经被 OCR 识别以及哪些 pdf 文件只是图像? 如果我跑ev,那将需要永远...

回答 5 投票 0

以Python列表格式提取图像中的删除线文本

我的任务是从图像中识别并提取带有删除线符号的文本。我只想选择具有此符号的单词并将每个实例放入列表中。 图像包含 Strikethr...

回答 1 投票 0

使用 pytesseract 从图像中提取字符串

我是 OCR 操作和从图像中提取数据的新手。搜索解决方案后,我确实找到了一些代码,但它不适用于我的用例,它没有正确提取所有字符,位于

回答 1 投票 0

PyTesseract 无法识别绿色背景上的文本

我在预处理时一直在摆弄图像,但超立方体无法检测液晶屏幕上的文本。它确实在它周围创建了一个边界框,我猜这意味着它找到了

回答 1 投票 0

KerasOCR、EasyOCR、Pytesseract 无法识别简单数字

我试图在我的单个字符图像上运行 OCR,所有图像都是数字。我尝试在图像上运行 EasyOCR、Keras-OCR 和 Pytesseract,但没有返回正确的输出。我什至尝试过 MNIST,但是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.