外部数据量大的情况下如何快速使用Google的Gemini?

问题描述 投票:0回答:1

我正在使用 Gemini 来分析来自客户的大量反馈数据。我想问模型问题,例如“最常见的投诉是什么?”以及“客户喜欢我们的服务什么?”。

我目前只是在提示中添加相关数据作为前缀,但这并且当数据太大时经常会抛出错误。

微调听起来像是可行的方法,但我只有原始数据,没有用于模型训练的输入/输出列表。有没有一种方法可以仅使用所有数据来微调模型?或者是否有另一种方法可以改变模型的状态以实现更快的提示响应?

请注意,我也尝试过 RAG 架构,但这似乎不是很有用,因为我已经提供了数据的子集(并且不需要对数据进行语义查询)。

large-language-model google-gemini
1个回答
0
投票

我不确定这种方法是否适合您的具体情况。因此,请将其视为可用的几个选项之一。

简单方法:语料库和生成答案

此方法利用语料库和generateAnswer 函数来实现简单的解决方案。目前,一个语料库最多可以容纳 100 万个块。如果你的“海量客户反馈数据”不足100万条,也许可以使用这种方法。工作流程如下:

  1. 创建语料库参考
  2. 创建文档参考
  3. 添加客户反馈数据:将“大量客户反馈数据”分割成块并将它们添加到文档中。 参考
  4. 分析反馈:使用 models.generateAnswer 函数的语义检索器来回答诸如“最常见的投诉是什么?”之类的问题。或“客户喜欢我们服务的哪些方面?” 参考

保留块,允许您合并新数据并使用整个数据集生成答案。

当然,您可以管理语料库和块。你可以看官方文档。 Ref 而且,作为一个简单的示例,您可以使用 Google Apps 脚本库简单地测试它。 参考

参考资料:

© www.soinside.com 2019 - 2024. All rights reserved.