向量数据库是否维护 RAG 系统的预向量分块数据?

问题描述 投票:0回答:1

我相信,当使用带有检索增强生成(RAG)方法的法学硕士时,从向量搜索检索到的结果最终必须以文本形式呈现。否则,提示将只包含一系列数字(向量),这是没有意义的。我假设预向量分块数据需要存储在向量数据库中的某个位置。这通常是在矢量数据库本身中维护的吗?

large-language-model vector-database retrieval-augmented-generation
1个回答
0
投票

在 RAG 系统中,矢量数据库仅存储代表文本的数字,而不存储文本本身。实际文本保存在不同的地方。当您搜索某些内容时,系统会使用这些数字来查找相关文本,然后将其呈现给您。

在典型的 RAG 系统中,矢量数据库不维护预矢量分块数据。相反,矢量数据库仅存储文本数据的矢量表示。预向量分块数据,包括原始文本段落或文档,通常单独存储在另一个数据库或数据源中。当使用向量执行检索时,系统根据从向量数据库检索的向量从这个单独的源检索相应的预向量分块数据。

© www.soinside.com 2019 - 2024. All rights reserved.