我想匹配,然后将字符串替换为最接近的匹配。我正在使用stringdist库。以下是我的代码
stringdistmatrix("2 ltr thums up", c("solar thyme 30g", "Thums Up 2 L"), method = "lv")
它给出如下输出:
[,1] [,2]
8 12
这意味着“太阳百里香30g”更接近“2 ltr thums up”,但实际上“Thums Up 2 L”应该更接近。我要将levenshtein方法改为其他方法吗?
我尝试了方法='余弦',输出看起来很好。