ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何在 Android 中从 Vision OCR 结果文本中提取姓名、电话号码和电子邮件地址?

这是我的示例代码,我想在其中获取详细信息...... @覆盖 protected void onActivityResult(int requestCode, int resultCode, Intent data) { if (requestCode == PHOTO_REQUEST && 结果...

回答 1 投票 0

如何使用 Python 和 Tesseract 改进低对比度和模糊报纸图像的 OCR 提取?

我正在开发一个 Django 应用程序,用于从剪报图像中提取文本。这些图像通常对比度低且模糊,并且包含各种文本块,例如标题、日期……

回答 1 投票 0

paddleocr,如何训练自己的数据集

我使用 PaddleOCR 进行项目并在 https://github.com/PaddlePaddle/PaddleOCR/blob/main/doc/doc_en/models_list_en.md 获取训练模型。但一切都没有改变。 所以我希望训练自己的数据集。 那...

回答 1 投票 0

EasyOCR 单独识别字母“e”时不一致

我在 Python 中有一个函数,可以使用 EasyOCR 读取葡萄牙语文本。由于某种原因,它并不总是识别较大单词之间的“e”,这是此中的常见连接词

回答 1 投票 0

Google Vision api 文本检测

我正在使用谷歌视觉API来识别图像中的文本。日语图像。 但回复不是日语,而是英语。谁能告诉我如何将英语改为

回答 2 投票 0

错误:(gcloud.alpha.functions.deploy)ResponseError:状态= [403],代码= [禁止],消息= [无法访问项目中的Google Cloud Functions API

我是 Google API 的新手。 我正在逐步遵循 Google 制作的下一个教程:https://cloud.google.com/functions/docs/tutorials/ocr 我想部署Goog提供的特定功能...

回答 3 投票 0

Google Vision 隐私:图像删除

我打算使用 Google Vision 进行文档识别。 例如,我将上传驾驶执照,我应该获取所有文本数据并验证它是驾驶执照而不是杂志的封面...

回答 6 投票 0

文字识别应用程序

现在我正在尝试制作可以识别文本的相机应用程序。为此,我使用谷歌指南中的信息。该网站介绍了如何制作全屏阅读器。但我需要设置移动视觉

回答 1 投票 0

使用 Google Cloud Vision 对手写文本进行分类

我正在探索 Google Cloud Vision 来检测文本中的手写内容。 我发现该模型在阅读手写文本时非常准确。 我正在遵循本指南:https://cloud.google.com/vision/docs/

回答 1 投票 0

iOS实时检测相机的一些标记

我想制作一个扫描仪,用于扫描角落里有特殊标记的文档。这样,当您打开相机时,您就会搜索文档上的标记,并在找到标记时自动拍照......

回答 2 投票 0

所有 com.android.support 库必须使用完全相同的版本规范。找到版本 28.0.0、26.1.0

您好,我正在制作一个使用谷歌 OCR API 从图像中提取文本的应用程序。我面临依赖问题的问题。我认为版本有冲突,但我不明白......

回答 1 投票 0

从文档中删除文本,只留下模板

我使用doctr库来识别文本并获取pdf文档中文本的坐标。但是,我根本不需要该文档中的文本,只需要文档模板。 我正在寻找...

回答 1 投票 0

我可以将 Drupal document_ocr 与 tesseract 集成吗?

我想使用开源图像到文本转换器来填充 Drupal 中的文本字段。 我尝试在settings.php中设置tesseract可执行路径,并认为document_ocr mo...

回答 1 投票 0

对图像中的手写和打印文本进行分类、分割和提取

该项目的目标是首先对图像中的手写和打印文本进行分割(或绘制边界框)和分类,然后从图像中提取手写和打印文本。印刷的TE...

回答 1 投票 0

如何在 Tesseract 中使用配置变量?

我成功完成了本教程:Tesseract OCR iOS 教程。它使用 Tesseract OCR iOS 框架。 该应用程序与教程提供的示例图像配合良好,但我的...

回答 1 投票 0

通过向 CNN 输入添加位置和字符信息来增强文档布局分析

我正在研究文档布局分析,并一直在探索 CNN 和基于 Transformer 的网络来完成这项任务。通常,图像作为 3 通道 RGB 输入传递到这些网络。然而,我的

回答 1 投票 0

如何将图像中的base64数据解码为文本?

今天有人问我这个奇怪的问题,我无法给出直接答案。 我有一张描绘 Base64 文本的图像。我怎样才能将其转换为文本? 我通过 pytesseract 尝试过这个,但是在 tessera 中......

回答 2 投票 0

如何从图像中提取文本并在提取的文本周围绘制边框

我正在尝试使用 OCR 从图像中提取文本。我面临的挑战是如何映射键和值。例如,键 - 姓氏应具有值 XYZ。拿到钥匙后...

回答 1 投票 0

如何在图像opencv中的表格中添加水平线

我想在下图中添加水平线 结果输出应该是这样的: 任何关于如何解决这个问题的方法,即使存在没有水平线的差异图像。 我试过了...

回答 1 投票 0

如何使用 Tesseract 识别图像中的单个字符?

这是原图: 这是处理后的图像: 我正在尝试自动化一个迷你游戏,其中角色出现在屏幕上。我做了一些简单的研究并设法处理图像......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.