Google Vision API - 我们是否可以在检测文档文本时加入自定义预处理逻辑,并直接将其作为Vision API使用。

问题描述 投票:0回答:1

我正在使用Google Vision API从我的图像中获取所有的文本。然而,我想通过调整图像的大小,只提取图像上特定区域的文本,而不是整个文本。然而,对于所有的图像来说,该区域并没有被定义为一个固定的坐标;图像是错误的屏幕截图,其中的信息可能在任何一侧,有时屏幕截图是由显示器上的多个窗口打开的。我想使用自定义逻辑,首先处理图像,以确定错误信息可能存在的部分,并只对该部分进行分割,然后将该部分图像传递给文本提取。但是我不想在Vision API之外有任何预处理逻辑。有没有一种方法可以让我们在Vision API框架内加入额外的预处理逻辑,并得到一个可以同时进行预处理和文本提取的api?

ocr google-vision vision-api
1个回答
0
投票

答案很简单:没有

google vision test-detection API很短,也很简单,并没有提供任何方法来实现你的要求。

© www.soinside.com 2019 - 2024. All rights reserved.