如何找到两个向量之间的距离,其中某些字段是字符串(名称,地址等)而其他字段是数字

问题描述 投票:0回答:1

我必须找到2条记录之间的距离。每个记录都是多个字段的向量。其中一些字段是数字。其他是字符串。如何得出距离的单个值。

我可以分别计算每个字符串变量的字符串距离和数字变量的欧几里得距离。在这种情况下,我该如何结合这两个距离值

machine-learning artificial-intelligence knn
1个回答
0
投票

这确实取决于您要执行的操作。例如,与其寻找地址字符串之间的距离,不如花些时间将它们转换为地理位置并测量其距离。

查找字符串之间的距离实际上没有意义,但是您可以找到它们的字符串距离并使用一些权重,以使它们不会使数值无效。

基本上,您需要对文本数据进行某种类型的预处理预处理。

© www.soinside.com 2019 - 2024. All rights reserved.