ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

Google Cloud Vision API 中的 OCR 功能和图像分割

我正在为一个涉及光学字符识别（OCR）的项目探索Google Cloud Vision API。我的项目不仅需要从图像中提取文本，还需要分割...

python image-processing ocr image-segmentation google-cloud-vision

回答 2 投票 0

Google Cloud Vision API 是否检测 OCRed 文本中的格式，例如粗体、斜体、字体名称（helvetica 或 times new roman）等？

敏捷的棕色狐狸跳过了懒狗在这种情况下，假设也有不同的字体系列，云视觉 API 是否可以检测到这一点。或者任何其他 OCR API 都能清楚地检测到这一点。测试...

ocr tesseract google-cloud-vision abbyy abbyy-cloud-ocr

回答 3 投票 0

使用OpenCV实现Python脚本连续抓取屏幕并显示

我想实时捕获我的在线游戏并在玩家姓名上创建矩形框并使用 OCR 读取这些姓名。实现代码后，我面临多个屏幕的错误。

python computer-vision ocr

回答 1 投票 0

使用 Azure，有没有办法可以检测文本方向？

我目前正在通过 Python 使用 Auzre Vision API，如下所示：导入 azure.ai.vision 作为愿景 service_options = Vision.VisionServiceOptions( os.environ["PAY_VISION_ENDPOINT"]，os.

python azure ocr orientation

回答 1 投票 0

Tesseract ocr PDF 作为输入

我正在构建一个 OCR 项目，并且正在使用 Tesseract 的 .Net 包装器。包装器的示例未显示如何处理 PDF 作为输入。使用 PDF 作为输入如何生成搜索...

c# ocr tesseract

回答 5 投票 0

如何阻塞 OCDNet 管道并仅在 OCRNet 上获取结果？（NVIDIA 光学字符检测和识别解决方案/OCDR）

我正在 Jetson 上本地运行 NVIDIA 光学字符检测和识别解决方案。我想阻止 OCDNet 的管道，只使用 OCRNet 进行推断。我把所有代码都注释掉了...

machine-learning computer-vision ocr nvidia

回答 1 投票 0

全新安装后，tesseract 完全乱码

全新安装 tesseract（使用此处的最新 Windows 安装程序）基本的Python代码导入 pytesseract 从 PIL 导入图像 def main(): image = Image.open("mac.jpg")

ocr tesseract python-tesseract

回答 1 投票 0

仅使用基于 LSTM 的模型进行 Tesseract 初始化

我正在尝试制作一个可以识别匈牙利语图像中的文本的应用程序。我发现匈牙利训练数据文件仅适用于基于 LSTM 的识别。我的代码是：资产帮助...

java lstm ocr tesseract

回答 1 投票 0

如何在js中查找图像中的模式

我是图像世界中的人工智能和文本识别新手，我正在尝试使用 javascript 识别图像中的字符模式，但我完全不知道从哪里开始。我的目标是...

javascript tensorflow ocr object-detection yolo

回答 1 投票 0

印度银行IFSC代码正则表达式

IFSC 代码由前 4 个字母组成，然后是“0”，然后是 6 位数字。正则表达式如下 [A-Z|a-z]{4}[0][\d]{6}$ 但我正在使用 OCR 来提取文本，所以我正在清理代码 ifsc_code =

python python-3.x opencv computer-vision ocr

回答 2 投票 0

Document Intelligence Azure，API 和 Studio 模型之间存在结果差异

我正在使用预建布局模型：打开（file_path，“rb”）作为pdf：打印（pdf）轮询器 = document_analysis_client.begin_analyze_document( model_id="预建布局...

python azure ocr

回答 1 投票 0

使用 Python 去扭曲页面的最佳方法是什么？

似乎以下是唯一一个对页面进行扭曲处理的Python软件： https://pypi.org/project/page-dewarp/ 如果我错了，请纠正我，但我尝试查找 pytesseract 是否自动 de...

python ocr

回答 1 投票 0

使用tessaract进行图像识别

我正在尝试识别数字及其在图像中的位置这是我的代码：导入CV2 导入 pytesseract def round_to_nearest_10(number): 回程(次数/10) * 10 def parse_image...

python ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

Tesseract5-OCR 训练 - 分段故障错误

我正在尝试使用新字体训练 tesseract 5。我在 WSL Ubuntu 上运行 tesseract，并遵循 Gabriel Garcia 的教程和官方 tesseract 编译文档。我正在尝试训练 tesserac...

makefile ocr tesseract windows-subsystem-for-linux tesseract-5.x

回答 1 投票 0

使用正则表达式查找具有相似性的文本

我识别了不同 PDF 文档中的文本列表。现在我需要使用正则表达式从每个文本中提取一些值。我的一些模式是这样的：一些文字[ -]?(.+)[ ,-]+...

java regex ocr string-matching string-parsing

回答 1 投票 0

如何安装Detectron2

我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装

python nlp data-science ocr python-3.10

回答 3 投票 0

Android：如何在不拍照的情况下从相机捕获文本？

我想捕获用相机显示的文本和数字，而不使用tess-two（在android和eclipse中）拍照。我不想保存图像文件。像这样的东西（它正在捕捉生活......

android ocr

回答 3 投票 0

PDF 字体名称中带有空格会导致打印机错误

一些背景：我维护着一个大部分未索引的科学文献档案，在这种情况下，使用扫描纸质文档和随后的 OCR 来生成可搜索的文本。这有效...

pdf printing ocr acrobat

回答 1 投票 0

上传 100 个 blob 时失败的 Azure 逻辑应用程序和 OCR

我正在做一个Azure逻辑应用程序，旨在对上传的图片进行OCR，然后使用以下序列在另一个blob中创建JSON输出，但没有任何反应：这是详细配置...

azure azure-blob-storage ocr azure-logic-apps azure-ai

回答 1 投票 0

我在使用 Donut 模型时遇到错误：输入类型和偏差类型应该相同

我正在尝试使用甜甜圈模型（图像解析器）从图像中提取文本。输入图像的格式似乎不正确。我收到一条错误消息：运行时错误：输入...

python numpy python-imaging-library ocr donut

回答 1 投票 0

ocr 相关问题

最新问题