ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

在 Windows 上实现“实时屏幕捕获”文本检测/提取

嗨,实现从电脑屏幕本身(可能是屏幕的一部分)的“实时馈送或捕获”检测文本的最佳方法是什么,以便程序可以基于什么执行...

回答 1 投票 0

重新调整 GCP 文档 AI 结果

GCP 的文档 AI 正在对图像进行预处理,以消除倾斜等问题。它生成的边界框对应于预处理的图像,而不是发送到 API 的图像。我需要重新倾斜它们所以......

回答 1 投票 0

在 PDF 文件中嵌入/插入/添加由“Google Cloud Vision (OCR)”生成的 JSON OCR 数据并使 PDF 可搜索

我正在使用 Google Cloud Vision API (OCR) 通过 PHP API 库检测 PDF 文件中的文本。 OCR 完美完成,我已经保存了完整的 JSON 输出文件集(例如,output-1-to-2.j...

回答 1 投票 0

配置 Google Document AI 以启用“computeStyleInfo”,但在响应中未收到任何 textStyles

Document AI 响应对象中的 textStyles 数组为空,尽管已按照 google 的 docAI 文档设置了所有内容。 我启用了文档 AI 的字体样式检测,如下所示...

回答 1 投票 0

itext7 与 .net core 应用程序中的 pdfocr。兼容性问题

我需要在.net core 6应用程序中读取PDF图像。我正在尝试使用 itext7 和 pdfocr 但我收到错误 严重性代码 说明 项目文件行抑制状态 警告 N...

回答 1 投票 0

Pytesseract OCR 将“o”识别为“0”

我正在尝试使用 pytesseract 库读取此图像上的文本。 原始截图.png 这是我的代码: 路径='原始屏幕截图.png' 图像 = cv2.imread(路径) 图像 = cv2.cvtColor(图像, cv2.

回答 1 投票 0

准确检测图像中随机旋转的文本

我正在尝试检测项目中的文本,这些项目可能会向各个方向旋转。我尝试过使用 Tesseract、EasyOCR 和 EAST 进行文本检测和提取,但遇到了问题

回答 1 投票 0

检测OCR文本图像是否上下颠倒

我有数百张图像(扫描文档),其中大多数都是倾斜的。我想使用 Python 来消除它们的偏差。 这是我使用的代码: 将 numpy 导入为 np 导入CV2 来自 skimage.transform

回答 4 投票 0

从图像中删除(裁剪)文本

我正在尝试实现一个图像识别程序,我需要删除(或“裁剪”)图像上存在的所有文本,例如: 对此: 我已经尝试过 Keras OCR m...

回答 2 投票 0

粗体文本检测

我目前正在开发一个项目,我需要检测多字体大小图像上的粗体文本(因此不可能使用数学形态学)。该检测将与 OCR 系统并行使用(带有

回答 1 投票 0

是否可以通过PaddleOCR获取文本区域的旋转角度?

PaddleOCR 在 use_angle_cls=True 模式下可以正确识别 90 度、180 度甚至 270 度旋转文本,但它在结果中不提供任何有关旋转角度的信息。因此,...

回答 1 投票 0

如何判断图像中的文字是否上下颠倒?

我需要确定图像上的文字是否颠倒。我的图像示例: 1 2 3 4 5 我通过比较原始图像和 180 度旋转图像的置信度分数来做到这一点,但有时......

回答 1 投票 0

使用

我想从这张图片中的表中提取数据,我使用 cv2 和 pytesseract 但我没有得到可靠的结果。这是我的代码和我的图像。 在此输入图像描述 导入CV2 导入 pytess...

回答 1 投票 0

Python 立即在屏幕上查找数字

我有一个包含 75 张黑白图像的文件夹,所有图像都包含 1-75 的数字。我想做的是,当这些数字之一出现在我的屏幕上时,我想打印它的数字......

回答 2 投票 0

Datacap 是否有办法读取可搜索的 pdf 而不是使用 OCR?

我正在使用可搜索的 pdf,无需 OCR 文档。 Datacap 中是否有可以读取数据而不是使用 OCR 的规则/操作?

回答 1 投票 0

使用node javascript:如何使用OpenAI api作为本地图像的OCR?

我尝试使用openApi的api作为本地图像中gpt-4o模型的节点中的OCR。 const api_key = “mykey” 从“openai”导入 OpenAI; 从“fs”导入 fs const openai = 新 Ope...

回答 0 投票 0

Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

我正在尝试使用 mss 和 pytesseract 在 python 中创建实时 OCR。 到目前为止,我已经能够捕获 FPS 稳定为 30 的整个屏幕。如果我想捕获较小的区域...

回答 4 投票 0

将图像从反应本机转换为多部分表单数据

我想将图像从 React Native 转换为多部分/表单数据格式, 类似于 ReactJS 中的图像数据:, 要与此 API 一起使用:https://rapidapi.com/iq.faceok/api/ocr-extract-text/playground/

回答 1 投票 0

如何使用 PyTesseract 读取给定图像上的小数字

我正在尝试使用 OpenCV 和 Pytesseract 循环遍历该图像(或类似图像)底部的白色数字并记录每个数字。 虽然我有正确的逻辑来确定...

回答 1 投票 0

识别一种类型文档的不同模板

如果我在这里问了错误的问题,我提前道歉。但不要严格判断,只要告诉我去哪里或提供信息链接即可。 我的问题的本质如下:我有

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.