比较 R 中两列中每行中存储的文本

问题描述 投票:0回答:1

我有 2 个向量

a=c("abc","def","ghi","jkl")  
b=c("abc","dez","gyx","mno")

如何获取余弦值来比较相应的条目?在这种情况下,我需要能够说每个向量中的第一个条目完全相似,每个向量中的第二个条目稍微相似......每个向量中的最后一个条目完全不同?我尝试了 lsa 包 - 但我可以获得整体余弦值

r text-mining cosine-similarity lsa
1个回答
0
投票

您可以使用

stringdist
套餐

stringdist(a, b, method = "cosine")
#[1] 0.0000000 0.3333333 0.6666667 1.0000000
© www.soinside.com 2019 - 2024. All rights reserved.