我正在为一个涉及光学字符识别(OCR)的项目探索 Google Cloud Vision API。我的项目不仅需要从图像中提取文本,还需要将这些图像分割成单独的单词或字符。
我已阅读文档,但我需要澄清以下几点:
如果您能提供任何指导或资源,帮助我了解 Google Cloud Vision API 满足我的项目要求的功能,我将不胜感激。
Google Cloud Vision 可以检测并提取图像中的文本。您可以使用视觉 API 进行图像标记、人脸和地标检测、光学字符识别 (OCR) 以及显式内容标记。
您可以使用云视觉高级文本识别DOCUMENT_TEXT_DETECTION功能来提取单词、字符及其对应的坐标。该功能的响应针对密集的文本和文档进行了优化。当您发送图像时,它会识别单词、字符、片段及其坐标。有关更多信息,您可以参考这些链接link1和link2。
Google Cloud 的企业文档 OCR 产品提供符号级文本检测