为 RAG 实现摄取文本分块/嵌入生成时,摄取的数据“存储”在哪里?

问题描述 投票:0回答:1

我一直在对此进行研究 - 我正在构建一个 RAG 聊天机器人应用程序,使用摄取的数据来查询文档问答。

我正在努力为我的法学硕士提供可用的数据;在本地开发时,我将其摄取到与嵌入+矢量存储完成的同一文件中,或者如果可能的话,不全部摄取到一起,但是我会丢失数据吗?

当我在本地开发时以及何时“存在”什么?我可以提取和加载文档,然后将它们分块,然后嵌入+矢量存储,然后提问。我怀疑这一切都应该放在同一个 .py 文件中。那么它是如何工作的呢?

我尝试过使用单独的文件/模块并全部在一个 .py 脚本中进行摄取。结果通常是“没有可用数据来回答这个问题”,但我可以在命令行中打印出摄取文档的文本。我还尝试过在线和本地 LLM 选项,例如 Google Gemini 和 Ollama 的本地模型。

python artificial-intelligence chatbot large-language-model
1个回答
0
投票

鉴于您使用的是 Python,我们没有有关您的实现的详细信息。您可以分享您正在使用的堆栈/库吗?

如果我理解得很好,似乎你是在运行时在内存中做所有事情。与矢量存储数据库的简单连接可能会解决您的问题。

© www.soinside.com 2019 - 2024. All rights reserved.