我正在使用 Gemini 来分析来自客户的大量反馈数据。我想问模型问题,例如“最常见的投诉是什么?”以及“客户喜欢我们的服务什么?”。
我目前只是在提示中添加相关数据作为前缀,但这慢并且当数据太大时经常会抛出错误。
微调听起来像是可行的方法,但我只有原始数据,没有用于模型训练的输入/输出列表。有没有一种方法可以仅使用所有数据来微调模型?或者是否有另一种方法可以改变模型的状态以实现更快的提示响应?
请注意,我也尝试过 RAG 架构,但这似乎不是很有用,因为我已经提供了数据的子集(并且不需要对数据进行语义查询)。
我不确定这种方法是否适合您的具体情况。因此,请将其视为可用的几个选项之一。
此方法利用语料库和generateAnswer 函数来实现简单的解决方案。目前,一个语料库最多可以容纳 100 万个块。如果你的“海量客户反馈数据”不足100万条,也许可以使用这种方法。工作流程如下:
保留块,允许您合并新数据并使用整个数据集生成答案。
当然,您可以管理语料库和块。你可以看官方文档。 Ref 而且,作为一个简单的示例,您可以使用 Google Apps 脚本库简单地测试它。 参考