Google Cloud Vision API 中的 OCR 功能和图像分割

问题描述投票：0回答：2

我正在为一个涉及光学字符识别（OCR）的项目探索 Google Cloud Vision API。我的项目不仅需要从图像中提取文本，还需要将这些图像分割成单独的单词或字符。

我已阅读文档，但我需要澄清以下几点：

如果您能提供任何指导或资源，帮助我了解 Google Cloud Vision API 满足我的项目要求的功能，我将不胜感激。

python

image-processing

ocr

image-segmentation

google-cloud-vision

2个回答

1
投票

Google Cloud Vision 可以检测并提取图像中的文本。您可以使用视觉 API 进行图像标记、人脸和地标检测、光学字符识别 (OCR) 以及显式内容标记。

您可以使用云视觉高级文本识别DOCUMENT_TEXT_DETECTION功能来提取单词、字符及其对应的坐标。该功能的响应针对密集的文本和文档进行了优化。当您发送图像时，它会识别单词、字符、片段及其坐标。有关更多信息，您可以参考这些链接link1和link2。

0
投票

Google Cloud 的企业文档 OCR 产品提供符号级文本检测