如何在自定义数据上高效训练 ChatGPT?

问题描述 投票:0回答:1

我正在使用数据集(csv 格式)并使用 Python 中的 ChatGPT API 创建自定义训练的聊天机器人。大约有 1000 个观测值和 12 个变量。我能够训练模型,但是当使用提问时,聊天机器人没有给出所需的结果。例如,当我问“员工的平均年龄是多少?”我得到的结果是 15.5,这是不正确的(应该在 40 左右)。另一个例子,“数据集中有多少男性?”,输出是 60,但数据集中有 340 名男性。

我很确定这与预处理数据有关,但我无法解决它。我的另一个方法是将其转换为json格式,模型可以从中更准确地学习。

还有其他人遇到过这个问题吗?还有其他人遇到过这个问题吗?你是怎么解决的?

nlp artificial-intelligence chatbot openai-api llm
1个回答
0
投票
There are many ways to create your own chatbot and send data to ChatGPT, but not all of them give accurate results.

就你的情况而言,我建议你在编写 Python 的同时检查和测试其他方法并从中获取一些东西以改进你自己的开发

例如,这里有一个 现成的解决方案,允许您将数据上传到 ChatGPT 并在几分钟内创建一个聊天机器人。 这是我建议您开始的地方。

附注链接中提到的解决方案 - 将 csv 文件解析为疯狂

© www.soinside.com 2019 - 2024. All rights reserved.