将距离矩阵传递给 sklearn 的 K 均值聚类

问题描述 投票:0回答:0

我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想对这些语言执行 K-Means 聚类。

我将距离矩阵传递给 sklearn 的 K-Means 聚类并得到有意义的结果。

但是我读到 K-Means Clustering 不能使用这里的距离矩阵。但如果是这样的话,为什么我会得到有意义的集群(即,彼此接近的语言在同一个集群中)?我得到的结果看起来是正确的吗?

我尝试使用经典(公制)多维缩放(CMD Sacling)来降低我的数据集的维度,但是当我这样做时,结果集群变得很奇怪并且没有多大意义。

任何帮助将不胜感激!

python cluster-analysis k-means distance-matrix multi-dimensional-scaling
© www.soinside.com 2019 - 2024. All rights reserved.