我有两个数据集D1和D2。每个数据集都有n个特征(列),特征值具有不同的比例。我需要找到D1和D2中每个相关样本对之间的余弦距离,以量化D1和D2有多少相似。使用余弦距离之前,我是否需要归一化D1和D2?我正在使用scipy.spatial.distance.cosine(u,v)查找样本u和样本v之间的距离。
谢谢!
我有两个数据集D1和D2。每个数据集都有n个特征(列),特征值具有不同的比例。我需要找到D1中每个相关样本对之间的余弦距离,并且...
您需要在python中使用scipy.spatial.distance.cosine()之前对数据进行规范化吗?