我正在尝试使用 Gemini API (1.5-pro) 从 pdf 中提取信息。 目前,该 API 似乎只能访问文本、音频文件或图像。有什么方法可以访问 PDF 文件(例如通过 Vertex AI 或 Google Drive 上传)? 当前的文档相当不透明。
Gemini 的文件 API 不支持 pdf。
但是你可以做的正是 ai studio 所做的,将 pdf 文件解析为文本,然后将其添加为提示的一部分