我们正在寻求将 PDF 文档中的图像从不同语言翻译成英语。 它们是扫描图像,很多时候里面有表格或某种结构。我们想翻译成英文,但尽可能保留文档的结构。因此,仅基于纯文本的翻译是不够的。
我们在 Android 上看到谷歌翻译应用程序,它似乎可以对手机上的照片做类似的事情。是否有谷歌云 API 做同样的事情?
为了通过 Google 云执行此操作,我们应该使用哪个 API?
使用谷歌云产品,您可以使用 OCR 提取文本和翻译 API 将文本翻译成英文来实现这一点。
我建议使用 Document AI 进行 OCR,因为该 API 旨在解析表单和表格。您可以查看Document AI Table parsing和Document AI Document parsing以获取有关如何使用API的示例。使用提取的文本,您可以使用翻译 API 翻译提取的文本.
高级步骤: