ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

在 Windows 上实现“实时屏幕捕获”文本检测/提取

嗨，实现从电脑屏幕本身（可能是屏幕的一部分）的“实时馈送或捕获”检测文本的最佳方法是什么，以便程序可以基于什么执行...

python-3.x opencv ocr python-tesseract image-recognition

回答 1 投票 0

重新调整 GCP 文档 AI 结果

GCP 的文档 AI 正在对图像进行预处理，以消除倾斜等问题。它生成的边界框对应于预处理的图像，而不是发送到 API 的图像。我需要重新倾斜它们所以......

google-cloud-platform image-processing ocr bounding-box cloud-document-ai

回答 1 投票 0

在 PDF 文件中嵌入/插入/添加由“Google Cloud Vision (OCR)”生成的 JSON OCR 数据并使 PDF 可搜索

我正在使用 Google Cloud Vision API (OCR) 通过 PHP API 库检测 PDF 文件中的文本。 OCR 完美完成，我已经保存了完整的 JSON 输出文件集（例如，output-1-to-2.j...

php pdf ocr google-cloud-vision google-cloud-php-client

回答 1 投票 0

配置 Google Document AI 以启用“computeStyleInfo”，但在响应中未收到任何 textStyles

Document AI 响应对象中的 textStyles 数组为空，尽管已按照 google 的 docAI 文档设置了所有内容。我启用了文档 AI 的字体样式检测，如下所示...

javascript node.js google-cloud-platform ocr cloud-document-ai

回答 1 投票 0

itext7 与 .net core 应用程序中的 pdfocr。兼容性问题

我需要在.net core 6应用程序中读取PDF图像。我正在尝试使用 itext7 和 pdfocr 但我收到错误严重性代码说明项目文件行抑制状态警告 N...

c# pdf .net-core ocr itext7

回答 1 投票 0

Pytesseract OCR 将“o”识别为“0”

我正在尝试使用 pytesseract 库读取此图像上的文本。原始截图.png 这是我的代码：路径='原始屏幕截图.png' 图像 = cv2.imread(路径) 图像 = cv2.cvtColor(图像, cv2.

python ocr tesseract python-tesseract

回答 1 投票 0

准确检测图像中随机旋转的文本

我正在尝试检测项目中的文本，这些项目可能会向各个方向旋转。我尝试过使用 Tesseract、EasyOCR 和 EAST 进行文本检测和提取，但遇到了问题

python image-processing ocr tesseract text-extraction

回答 1 投票 0

检测OCR文本图像是否上下颠倒

我有数百张图像（扫描文档），其中大多数都是倾斜的。我想使用 Python 来消除它们的偏差。这是我使用的代码：将 numpy 导入为 np 导入CV2 来自 skimage.transform

python opencv ocr image-rotation skew

回答 4 投票 0

从图像中删除（裁剪）文本

我正在尝试实现一个图像识别程序，我需要删除（或“裁剪”）图像上存在的所有文本，例如：对此：我已经尝试过 Keras OCR m...

python opencv keras ocr

回答 2 投票 0

粗体文本检测

我目前正在开发一个项目，我需要检测多字体大小图像上的粗体文本（因此不可能使用数学形态学）。该检测将与 OCR 系统并行使用（带有

computer-vision ocr computer-science font-style

回答 1 投票 0

是否可以通过PaddleOCR获取文本区域的旋转角度？

PaddleOCR 在 use_angle_cls=True 模式下可以正确识别 90 度、180 度甚至 270 度旋转文本，但它在结果中不提供任何有关旋转角度的信息。因此，...

image text ocr orientation paddleocr

回答 1 投票 0

如何判断图像中的文字是否上下颠倒？

我需要确定图像上的文字是否颠倒。我的图像示例： 1 2 3 4 5 我通过比较原始图像和 180 度旋转图像的置信度分数来做到这一点，但有时......

image text ocr

回答 1 投票 0

使用

我想从这张图片中的表中提取数据，我使用 cv2 和 pytesseract 但我没有得到可靠的结果。这是我的代码和我的图像。在此输入图像描述导入CV2 导入 pytess...

python ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

Python 立即在屏幕上查找数字

我有一个包含 75 张黑白图像的文件夹，所有图像都包含 1-75 的数字。我想做的是，当这些数字之一出现在我的屏幕上时，我想打印它的数字......

python image numbers ocr

回答 2 投票 0

Datacap 是否有办法读取可搜索的 pdf 而不是使用 OCR？

我正在使用可搜索的 pdf，无需 OCR 文档。 Datacap 中是否有可以读取数据而不是使用 OCR 的规则/操作？

pdf ocr searchable

回答 1 投票 0

使用node javascript：如何使用OpenAI api作为本地图像的OCR？

我尝试使用openApi的api作为本地图像中gpt-4o模型的节点中的OCR。 const api_key = “mykey” 从“openai”导入 OpenAI；从“fs”导入 fs const openai = 新 Ope...

javascript node.js ocr openapi chatgpt-api

回答 0 投票 0

Pytesseract 对于实时 OCR 来说非常慢，有什么方法可以优化我的代码吗？

我正在尝试使用 mss 和 pytesseract 在 python 中创建实时 OCR。到目前为止，我已经能够捕获 FPS 稳定为 30 的整个屏幕。如果我想捕获较小的区域...

python opencv ocr tesseract python-tesseract

回答 4 投票 0

将图像从反应本机转换为多部分表单数据

我想将图像从 React Native 转换为多部分/表单数据格式，类似于 ReactJS 中的图像数据：，要与此 API 一起使用：https://rapidapi.com/iq.faceok/api/ocr-extract-text/playground/

react-native ocr multipartform-data imagepicker expo-image-picker

回答 1 投票 0

如何使用 PyTesseract 读取给定图像上的小数字

我正在尝试使用 OpenCV 和 Pytesseract 循环遍历该图像（或类似图像）底部的白色数字并记录每个数字。虽然我有正确的逻辑来确定...

python ocr tesseract python-tesseract

回答 1 投票 0

识别一种类型文档的不同模板

如果我在这里问了错误的问题，我提前道歉。但不要严格判断，只要告诉我去哪里或提供信息链接即可。我的问题的本质如下：我有

python ocr image-recognition

回答 1 投票 0

ocr 相关问题

最新问题