如何聚类矢量组?

问题描述 投票:-1回答:1

我有大约1000个向量,每个向量有9000个数值。我需要一些方法来找到它们之间的相似性或将它们聚类。这样做的方法/算法是什么?我想过k-means,但它是否适用于那样的数据?提前致谢。

cluster-analysis
1个回答
-1
投票

在如此高的维度(9000)中,你很可能遭受维数的诅咒,我建议在使用如此高维度的聚类算法之前运行维数降低算法(例如PCA或T-SNE)。

您可以阅读更多有关降维技术here的信息

您还可以了解有关维度诅咒的更多信息,以及为什么难以在高维here中找到有意义的聚类。

© www.soinside.com 2019 - 2024. All rights reserved.