为什么Sphinx没有BM25的场重?

问题描述 投票:0回答:1

Sphinx默认排名的公式,SPH_RANK_PROXIMITY_BM25如下所示:

SPH_RANK_PROXIMITY_BM25 = sum(lcs*user_weight)*1000+bm25

分别为每个字段计算最长公共子序列,然后乘以user_weight。但是bm25只是一个文档范围的变量,并没有考虑用户字段。为什么会这样?

sphinx
1个回答
1
投票

仅仅因为它更快,在许多情况下质量就足够了。有一个自定义排名和bm25f在那里使用。默认情况下也不会考虑文档长度,它在索引期间需要index_field_lengths = 1。

© www.soinside.com 2019 - 2024. All rights reserved.