将距离矩阵传递给 sklearn 的 K 均值聚类

问题描述投票：0回答：0

我目前正在使用 ASJP 数据库进行研究，我有一个 30 种语言之间相似性的距离矩阵，形状为 (30 x 30)。我想对这些语言执行 K-Means 聚类。

我将距离矩阵传递给 sklearn 的 K-Means 聚类并得到有意义的结果。

但是我读到 K-Means Clustering 不能使用这里的距离矩阵。但如果是这样的话，为什么我会得到有意义的集群（即，彼此接近的语言在同一个集群中）？我得到的结果看起来是正确的吗？

我尝试使用经典（公制）多维缩放（CMD Sacling）来降低我的数据集的维度，但是当我这样做时，结果集群变得很奇怪并且没有多大意义。

任何帮助将不胜感激！

python

cluster-analysis

k-means

distance-matrix

multi-dimensional-scaling