如何确定层次聚类中的聚类数量

问题描述 投票:0回答:1

我在下面使用R中Ward的最小方差在分层聚类中发现了聚类模式。根据个人的特征是否有意义,我根据经验确定了五个聚类数。即使我使用高度(图中的“ Cut”线表示),我仍然得到相同的4个聚类,但是第5个聚类(蓝色的聚类)又减少了两个聚类。

enter image description here

[问题:我的问题是,即使根据研究的知识没有意义,也必须将第5个簇切成一个特定的高度吗?还是我可以凭经验决定保留5个集群?它会在分析中引入任何偏见吗?

[我在下面使用R中的Ward的最小方差在分层聚类中找到了聚类模式。我根据个人的特征是否使...决定了五个聚类数]]

r hierarchical-clustering
1个回答
1
投票

集群在一定程度上是主观的(甚至比有监督的学习还要主观),因为没有人知道有多少个集群的真实答案,或者它们是否真的足够不同以至于可以放在不同的类别中。如果您认为基于您的领域知识,第5类是没有意义的,那么您可以选择不将其划分为第5类。只要确保您清楚地写下来,这样人们就会知道您的工作以及原因。

© www.soinside.com 2019 - 2024. All rights reserved.