Google Vision API - 我们是否可以在检测文档文本时加入自定义预处理逻辑，并直接将其作为Vision API使用。

问题描述投票：0回答：1

我正在使用Google Vision API从我的图像中获取所有的文本。然而，我想通过调整图像的大小，只提取图像上特定区域的文本，而不是整个文本。然而，对于所有的图像来说，该区域并没有被定义为一个固定的坐标；图像是错误的屏幕截图，其中的信息可能在任何一侧，有时屏幕截图是由显示器上的多个窗口打开的。我想使用自定义逻辑，首先处理图像，以确定错误信息可能存在的部分，并只对该部分进行分割，然后将该部分图像传递给文本提取。但是我不想在Vision API之外有任何预处理逻辑。有没有一种方法可以让我们在Vision API框架内加入额外的预处理逻辑，并得到一个可以同时进行预处理和文本提取的api？