计算两个对象列表之间的相似性

问题描述 投票:0回答:2

我想计算两个不同长度的列表之间的相似性。特别是,相似性必须考虑到不同的条件:

- 如果A = B,则给出2个列表A和B,然后相似度(A,B)= 1

- 通常,如果B包含A,则相似性(A,B) - > 1。但是,相似性度量还应考虑两个列表中元素的数量。 (例如,如果A包含1000个对象而B只有一个,它也包含在A中,则相似性(A,B) - > 0)。

- 相似度(A,B)也定义阈值T.相似度值大于T表示两个列表相似。

余弦相似性可能与此问题有关,但我不知道如何使用子集和阈值。

我也发现了不同的方法,但没有指定阈值参数:

-A Similarity Measure for Indefinite Rankings

-Kendall rank correlation coefficient

algorithm similarity information-retrieval cosine-similarity
2个回答
2
投票

我认为你正在寻找某种相似性。

两个最突出的措施是Jaccard IndexSørensen–Dice coefficient


1
投票

在您的情况下,使用Jaccard similarity coefficient可能会有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.