ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

Google Cloud Vision API 中的 OCR 功能和图像分割

我正在为一个涉及光学字符识别(OCR)的项目探索Google Cloud Vision API。我的项目不仅需要从图像中提取文本,还需要分割...

回答 2 投票 0

Google Cloud Vision API 是否检测 OCRed 文本中的格式,例如粗体、斜体、字体名称(helvetica 或 times new roman)等?

敏捷的棕色狐狸跳过了懒狗 在这种情况下,假设也有不同的字体系列,云视觉 API 是否可以检测到这一点。或者任何其他 OCR API 都能清楚地检测到这一点。测试...

回答 3 投票 0

使用OpenCV实现Python脚本连续抓取屏幕并显示

我想实时捕获我的在线游戏并在玩家姓名上创建矩形框并使用 OCR 读取这些姓名。实现代码后,我面临多个屏幕的错误。

回答 1 投票 0

使用 Azure,有没有办法可以检测文本方向?

我目前正在通过 Python 使用 Auzre Vision API,如下所示: 导入 azure.ai.vision 作为愿景 service_options = Vision.VisionServiceOptions( os.environ["PAY_VISION_ENDPOINT"],os.

回答 1 投票 0

Tesseract ocr PDF 作为输入

我正在构建一个 OCR 项目,并且正在使用 Tesseract 的 .Net 包装器。包装器的示例未显示如何处理 PDF 作为输入。使用 PDF 作为输入如何生成搜索...

回答 5 投票 0

如何阻塞 OCDNet 管道并仅在 OCRNet 上获取结果? (NVIDIA 光学字符检测和识别解决方案/OCDR)

我正在 Jetson 上本地运行 NVIDIA 光学字符检测和识别解决方案。我想阻止 OCDNet 的管道,只使用 OCRNet 进行推断。我把所有代码都注释掉了...

回答 1 投票 0

全新安装后,tesseract 完全乱码

全新安装 tesseract(使用此处的最新 Windows 安装程序) 基本的Python代码 导入 pytesseract 从 PIL 导入图像 def main(): image = Image.open("mac.jpg")

回答 1 投票 0

仅使用基于 LSTM 的模型进行 Tesseract 初始化

我正在尝试制作一个可以识别匈牙利语图像中的文本的应用程序。我发现匈牙利训练数据文件仅适用于基于 LSTM 的识别。我的代码是: 资产帮助...

回答 1 投票 0

如何在js中查找图像中的模式

我是图像世界中的人工智能和文本识别新手,我正在尝试使用 javascript 识别图像中的字符模式,但我完全不知道从哪里开始。我的目标是...

回答 1 投票 0

印度银行IFSC代码正则表达式

IFSC 代码由前 4 个字母组成,然后是“0”,然后是 6 位数字。正则表达式如下 [A-Z|a-z]{4}[0][\d]{6}$ 但我正在使用 OCR 来提取文本,所以我正在清理代码 ifsc_code =

回答 2 投票 0

Document Intelligence Azure,API 和 Studio 模型之间存在结果差异

我正在使用预建布局模型: 打开(file_path,“rb”)作为pdf: 打印(pdf) 轮询器 = document_analysis_client.begin_analyze_document( model_id="预建布局...

回答 1 投票 0

使用 Python 去扭曲页面的最佳方法是什么?

似乎以下是唯一一个对页面进行扭曲处理的Python软件: https://pypi.org/project/page-dewarp/ 如果我错了,请纠正我,但我尝试查找 pytesseract 是否自动 de...

回答 1 投票 0

使用tessaract进行图像识别

我正在尝试识别数字及其在图像中的位置 这是我的代码: 导入CV2 导入 pytesseract def round_to_nearest_10(number): 回程(次数/10) * 10 def parse_image...

回答 1 投票 0

Tesseract5-OCR 训练 - 分段故障错误

我正在尝试使用新字体训练 tesseract 5。我在 WSL Ubuntu 上运行 tesseract,并遵循 Gabriel Garcia 的教程和官方 tesseract 编译文档。我正在尝试训练 tesserac...

回答 1 投票 0

使用正则表达式查找具有相似性的文本

我识别了不同 PDF 文档中的文本列表。现在我需要使用正则表达式从每个文本中提取一些值。我的一些模式是这样的: 一些文字[ -]?(.+)[ ,-]+...

回答 1 投票 0

如何安装Detectron2

我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装

回答 3 投票 0

Android:如何在不拍照的情况下从相机捕获文本?

我想捕获用相机显示的文本和数字,而不使用tess-two(在android和eclipse中)拍照。 我不想保存图像文件。 像这样的东西(它正在捕捉生活......

回答 3 投票 0

PDF 字体名称中带有空格会导致打印机错误

一些背景:我维护着一个大部分未索引的科学文献档案,在这种情况下,使用扫描纸质文档和随后的 OCR 来生成可搜索的文本。这有效...

回答 1 投票 0

上传 100 个 blob 时失败的 Azure 逻辑应用程序和 OCR

我正在做一个Azure逻辑应用程序,旨在对上传的图片进行OCR,然后使用以下序列在另一个blob中创建JSON输出,但没有任何反应: 这是详细配置...

回答 1 投票 0

我在使用 Donut 模型时遇到错误:输入类型和偏差类型应该相同

我正在尝试使用甜甜圈模型(图像解析器)从图像中提取文本。输入图像的格式似乎不正确。 我收到一条错误消息: 运行时错误:输入...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.