外部数据量大的情况下如何快速使用Google的Gemini？

问题描述投票：0回答：1

我正在使用 Gemini 来分析来自客户的大量反馈数据。我想问模型问题，例如“最常见的投诉是什么？”以及“客户喜欢我们的服务什么？”。

我目前只是在提示中添加相关数据作为前缀，但这慢并且当数据太大时经常会抛出错误。

微调听起来像是可行的方法，但我只有原始数据，没有用于模型训练的输入/输出列表。有没有一种方法可以仅使用所有数据来微调模型？或者是否有另一种方法可以改变模型的状态以实现更快的提示响应？

请注意，我也尝试过 RAG 架构，但这似乎不是很有用，因为我已经提供了数据的子集（并且不需要对数据进行语义查询）。

large-language-model google-gemini

1个回答

0
投票

我不确定这种方法是否适合您的具体情况。因此，请将其视为可用的几个选项之一。

简单方法：语料库和生成答案

此方法利用语料库和generateAnswer 函数来实现简单的解决方案。目前，一个语料库最多可以容纳 100 万个块。如果你的“海量客户反馈数据”不足100万条，也许可以使用这种方法。工作流程如下：

创建语料库参考
创建文档参考
添加客户反馈数据：将“大量客户反馈数据”分割成块并将它们添加到文档中。参考
分析反馈：使用 models.generateAnswer 函数的语义检索器来回答诸如“最常见的投诉是什么？”之类的问题。或“客户喜欢我们服务的哪些方面？” 参考。

保留块，允许您合并新数据并使用整个数据集生成答案。

当然，您可以管理语料库和块。你可以看官方文档。 Ref 而且，作为一个简单的示例，您可以使用 Google Apps 脚本库简单地测试它。参考

参考资料：

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.