如何在PostgreSQL中有效地索引2000个值的向量并找到最近的邻居?

问题描述 投票:0回答:1

我的特征向量超过2000个值。例如,假设我有10,000个向量,每个向量具有2000个十进制值。我需要为它们建立索引并为查询向量找到最近的邻居。我可以在PostgreSql中使用R树索引它们吗?如果是这样,我们该怎么做?还是有其他方法或任何其他数据库可以有效地做到这一点?

database postgresql indexing nearest-neighbor r-tree
1个回答
0
投票

2000维度上的R树可能比顺序扫描差很多。最好的选择是将表数据存储在索引中,并采用针对计算速度而预先组织的格式,然后辞职以扫描整个索引。这就是bloom indexes所做的(从概念上讲,对索引进行全面扫描。当然,数据的组织和计算是不同的。)

© www.soinside.com 2019 - 2024. All rights reserved.