Google Cloud Vision API 中的 OCR 功能和图像分割

问题描述 投票:0回答:2

我正在为一个涉及光学字符识别(OCR)的项目探索 Google Cloud Vision API。我的项目不仅需要从图像中提取文本,还需要将这些图像分割成单独的单词或字符。

我已阅读文档,但我需要澄清以下几点:

  • Google Cloud Vision API 能否将图像分割成单独的单词或字符并返回每个片段的坐标?
  • 如果是这样,它也可以将这些片段作为单独的图像返回吗?
  • 如果没有,使用 Google Cloud 服务实现此目标的最佳方法是什么?

如果您能提供任何指导或资源,帮助我了解 Google Cloud Vision API 满足我的项目要求的功能,我将不胜感激。

python image-processing ocr image-segmentation google-cloud-vision
2个回答
1
投票

Google Cloud Vision 可以检测并提取图像中的文本。您可以使用视觉 API 进行图像标记、人脸和地标检测、光学字符识别 (OCR) 以及显式内容标记。

您可以使用云视觉高级文本识别DOCUMENT_TEXT_DETECTION功能来提取单词、字符及其对应的坐标。该功能的响应针对密集的文本和文档进行了优化。当您发送图像时,它会识别单词、字符、片段及其坐标。有关更多信息,您可以参考这些链接link1link2


0
投票

Google Cloud 的企业文档 OCR 产品提供符号级文本检测

© www.soinside.com 2019 - 2024. All rights reserved.