哪个是用于以低密度差对多维数据进行聚类的最佳聚类算法?

问题描述 投票:1回答:1

我目前正在从事一个项目,希望对多维数据进行聚类。我尝试了K-Means聚类和DBSCAN聚类,两者都是完全不同的算法。

[K-Means模型返回了一个很好的输出,它返回了5个簇,但是我读到当维数较大时,欧几里得距离会失败,所以我不知道我是否可以信任此模型。 >

在尝试使用DBSCAN模型时

,该模型生成了许多噪声点,并将许多点聚集在一个群集中。我尝试使用KNN dist绘图方法来找到模型的最佳eps,但似乎无法使模型正常工作。这导致我得出的结论是,可能绘制的点的密度非常高,也许这就是我在一个群集中获得很多点的原因。

对于群集,我正在使用10个不同的数据列。 我应该更改我使用的算法吗?对于具有较小变化密度的多维数据,哪种算法会更好?

我目前正在从事一个项目,希望对多维数据进行聚类。我尝试了K-Means聚类和DBSCAN聚类,两者都是完全不同的算法。 K均值模型...

python cluster-analysis data-science k-means dbscan
1个回答
0
投票

也许这会为您提供一些启发:Scikit-learn clustering algorithms我建议您尝试一些。希望能有所帮助!

© www.soinside.com 2019 - 2024. All rights reserved.