KNN算法需要归一化

问题描述 投票:0回答:1

为什么KNN需要正常化?我知道这个过程将所有特征对结果的影响归一化,但是归一化之前与特定点V的“K”最近点将完全相同,因为归一化后“K”最接近特定点V.因此,关于欧几里德距离的归一化会有什么不同。毕竟KNN完全取决于欧几里德距离?提前致谢 !

algorithm machine-learning normalization knn nearest-neighbor
1个回答
1
投票

如果您在不同维度上具有不同的可变性,则大多数标准化技术将改变'K'最近邻居。

想象一下A =( - 5,0),B =( - 5,1)和C =(5,1)的数据集。现在考虑一个兴趣点(4.5,0)。显然,C是最近的邻居。

在两个维度中最小 - 最大归一化到(-1,1)之后,您的数据集变为A =( - 1,-1),B =( - 1,1),C =(1,1)。您的兴趣点对应于此新空间中的(0.9,-1)。因此,A现在是最近的邻居。

© www.soinside.com 2019 - 2024. All rights reserved.