ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

可以在用户端轻松改进的OCR模型

我正在构建OCR软件,为此我在多种字体上训练了一个模型,该模型是SVM但不是原则性的。 现在我希望软件的用户能够改进模式...

回答 0 投票 0

在 Docker 中读取图像时出现 IronOCR 错误

我使用 IronOCR 和 asp.net webapi 与 .net 7。在 Windows 中它工作正常,当我将它部署到 docker 并尝试在 JPG 图像字节数组上使用 OCR 我得到这个错误(它工作正常PDF)

回答 1 投票 0

在 OCR 中只允许某些单词

我使用 tesseract 包中的 ocr() 函数,我的输入图像上出现的单词池相对较少。同时图像不是那么好,这使得文本

回答 1 投票 0

unicharset_extractor:找不到命令

我想使用 tesseract 创建新的火车数据。因此,请按照以下网站中提到的步骤进行操作。 https://blog.cedric.ws/how-to-train-tesseract-301 我在 OS X 中执行 Unicharset 时出现以下错误

回答 2 投票 0

OCR 分割

希望你们一切都好,我在 OCR 分割方面需要一些帮助,我是 Python 和 OpenCV 的新手,我有一个大学项目是关于创建一个检测字符的程序......

回答 0 投票 0

OCR 从 Google AppScript 中的 PDF 表格读取列

这是我正在处理的 PDF 的非常准确的插图,使用非常专业的非绘画艺术程序制作: 我需要读取值“a、b、c”。 问题是咕...

回答 1 投票 0

Detectron2 在 Docker 容器中使用 layoutparser 预训练模型错误:未找到检查点

以下是我的 Dockerfile。 来自蟒蛇:3.9 运行 apt-get clean && apt-get update pip 安装——升级 pip 运行 pip 安装布局解析器 运行 pip 安装“layoutparser [ocr]” 跑...

回答 0 投票 0

使用结果 OCR 运行 SQL 查询并在网页上显示结果

我有一个网页,您可以在其中附上图片。网页中包含一个OCR,从网页获得的结果用于SQL查询。有一个问题,我得到的只是......

回答 0 投票 0

使用 Python 中的 OCR、pytesseract 和 opencv 翻译图像内的文本并将翻译后的文本写回 img(相同位置)时出现问题

我正在做一个关于 python 中的 OCR 翻译的项目。我正在尝试编写一个脚本,该脚本获取一个充满图像的网页,其中包含一些文本。通过 OCR 它将检测将被转录的文本...

回答 1 投票 0

创建两个模型的完整步骤,一个用于从图像中提取手写词,另一个用于对检测到的词进行分类

我是深度学习领域的初学者,我正在尝试创建两个模型,一个用于从图像中提取手写文字,我的意思是获取所有矩形的位置...

回答 0 投票 0

从图像中读取所有数字

我有这张图片: 我试着阅读所有这些数字。 我正在尝试 com.asprise.ocr java-ocr-api 我有这张图片: 我尝试阅读所有这些数字。 我正在尝试 <dependency> <groupId>com.asprise.ocr</groupId> <artifactId>java-ocr-api</artifactId> <version>15.3.0.3</version> </dependency> Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_SLOW); String s = ocr.recognize(new File[]{new File("img.png")}, Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT); System.out.println("Result: " + s); ocr.stopEngine(); 和 <dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>5.7.0</version> </dependency> //+ installed tesseract-ocr - 5.3.1.20230401 Tesseract tesseract = new Tesseract(); tesseract.setDatapath("D:\\programming\\tessaract-ocr\\tessdata"); String text = tesseract.doOCR(new File("img.png")); System.out.print(text); 但在这两种情况下,输出只是一些随机字符。 有一种方法可以从图像中读取数字吗? Edit1:我尝试了更大的数字,但仍然是同样的问题:

回答 0 投票 0

如何让 EasyOCR 返回 0 或空字符串

我有这个图像,EasyOcr 可以正常识别数字 图像 但是我也想得到空格,我怎样才能返回一个空字符串或者告诉我没有数字......

回答 1 投票 0

带有非标准字体的扫描打印文档

我尝试了多个 OCR 库,包括 Google Document AI - 但是文档没有以正确的格式提取。我应该如何进行这个练习? 我也尝试过使用

回答 0 投票 0

如何处理重叠/套印标签上的 OCR?

我正在使用下面的代码来提取信息 def text_extract(图像): print("text_extract Tessaract OCR ") img_rgb = cv2.cvtColor(图像,cv2.COLOR_BGR2RGB) 打印(pytesser ...

回答 1 投票 0

如何最大化ocr的视频准备?

我有一个从视频中提取字幕的简单方法,我的意思是,我为此编写了一个脚本。但这种方法的主要问题是为该过程准备视频。我在做基因...

回答 0 投票 0

如何使用 pypdf 对齐 pdf

我正在使用 pypdf(最新的 2023)从 PDF 中提取数据。所有文件都是数字化的,但有些表格似乎有点错位。这会抛出我的 page.extract_text() 方法,它使用 bo...

回答 0 投票 0

使用 Py tesseract 在 png 中提取一些文本

我尝试提取每张卡片的文本, 在此处输入图像描述。 到目前为止,我只是尝试简单地阅读图像并使用 pytesseract 提取文本,但我只是返回...中所有文本的 1 个单词...

回答 0 投票 0

在 tesseract 中禁用文档缩放

我对如何通过 Iron Tesseract 禁用 pdf 发票缩放的问题感到困惑。以及为什么我的 PDF 在添加图像后颠倒了。 它将我的 pdf 从宽度:826px 高度:1169 px 缩放到

回答 0 投票 0

Document AI OCR 中的段落编号

你能帮我吗: 我有一个希伯来语的 pdf,里面有编号的段落。使用 Google Document AI OCR API 处理此 pdf 后,我收到文本,其中段落编号总是出现

回答 0 投票 0

google vision OCR 阿拉伯文字检测

我正在使用 google vision API 进行文本检测,我得到了英语的预期结果但是当测试阿拉伯语时我没有得到结果,我在 google decumentation 中发现它支持多种语言 inc...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.