我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想对这些语言执行 K-Means 聚类。
我将距离矩阵传递给 sklearn 的 K-Means 聚类并得到有意义的结果。
但是我读到 K-Means Clustering 不能使用这里的距离矩阵。但如果是这样的话,为什么我会得到有意义的集群(即,彼此接近的语言在同一个集群中)?我得到的结果看起来是正确的吗?
我尝试使用经典(公制)多维缩放(CMD Sacling)来降低我的数据集的维度,但是当我这样做时,结果集群变得很奇怪并且没有多大意义。
任何帮助将不胜感激!