使用 Gemini API 访问 PDF 文件

我正在尝试使用 Gemini API (1.5-pro) 从 pdf 中提取信息。目前，该 API 似乎只能访问文本、音频文件或图像。有什么方法可以访问 PDF 文件（例如通过 Vertex AI 或 Google Drive 上传）？当前的文档相当不透明。

0
投票

Gemini 的文件 API 不支持 pdf。

但是你可以做的正是 ai studio 所做的，将 pdf 文件解析为文本，然后将其添加为提示的一部分