使用 Gemini API 访问 PDF 文件

问题描述 投票:0回答:1

我正在尝试使用 Gemini API (1.5-pro) 从 pdf 中提取信息。 目前,该 API 似乎只能访问文本、音频文件或图像。有什么方法可以访问 PDF 文件(例如通过 Vertex AI 或 Google Drive 上传)? 当前的文档相当不透明。

artificial-intelligence google-gemini gemini
1个回答
0
投票

Gemini 的文件 API 不支持 pdf。

但是你可以做的正是 ai studio 所做的,将 pdf 文件解析为文本,然后将其添加为提示的一部分

  1. 将文件读取为文本字符串
  2. 告诉我这个文本[转储字符串]
© www.soinside.com 2019 - 2024. All rights reserved.