我是一名正在实习的学生,任务出现了如何完全获得定制的gpt代理。我从来没有遇到过这样的事情,请帮忙
我找到了两种保护聊天机器人免受即时注入的方法:
还有其他方法/我需要做其他事情吗?我真的很想高质量地完成取决于我的工作
大多数实体这样做的方式是训练一个单独的网络,将提示分类为:
这就是 OpenAI、TikTok 和其他公司一直在做的事情——一种人工智能预过滤器。
一如既往,问题在于获取训练数据 - 获取足够的恶意和非恶意提示示例。
此时您开始手动查看收到的所有提示,并开始手动对它们进行分类,然后在它们上训练网络。