为 RAG 实现摄取文本分块/嵌入生成时，摄取的数据“存储”在哪里？

问题描述投票：0回答：1

我一直在对此进行研究 - 我正在构建一个 RAG 聊天机器人应用程序，使用摄取的数据来查询文档问答。

我正在努力为我的法学硕士提供可用的数据；在本地开发时，我将其摄取到与嵌入+矢量存储完成的同一文件中，或者如果可能的话，不全部摄取到一起，但是我会丢失数据吗？

当我在本地开发时以及何时“存在”什么？我可以提取和加载文档，然后将它们分块，然后嵌入+矢量存储，然后提问。我怀疑这一切都应该放在同一个 .py 文件中。那么它是如何工作的呢？

我尝试过使用单独的文件/模块并全部在一个 .py 脚本中进行摄取。结果通常是“没有可用数据来回答这个问题”，但我可以在命令行中打印出摄取文档的文本。我还尝试过在线和本地 LLM 选项，例如 Google Gemini 和 Ollama 的本地模型。

python

artificial-intelligence

chatbot

large-language-model

1个回答

0
投票

鉴于您使用的是 Python，我们没有有关您的实现的详细信息。您可以分享您正在使用的堆栈/库吗？

如果我理解得很好，似乎你是在运行时在内存中做所有事情。与矢量存储数据库的简单连接可能会解决您的问题。