我有一个数据集,其中包含每个州的年份测试分数,我使用以下代码对其进行了聚类:
cluster.m4 <- na.omit(states.data, cols="AVG_MATH_4_SCORE")
d <- dist(cluster.m4$AVG_MATH_4_SCORE)
hp <- hclust(d)
plot(hp, hang = -1, labels=cluster.m4$STATE)
rect.hclust(hp, k=4, border="red")
我得到的输出如下:
它现在的方式,没有简单的方法来阅读标签。有没有办法让我只显示其中一个群集,以便我能够阅读标签?
您可以使用统计数据中的cutree
将树形图分成多个部分。你可以指定
k:具有所需组数的整数标量或向量
要么
h:数字标量或具有高度的向量,其中应该剪切树。
根据你的形象,我认为在15的高度切割会起作用:
cutree(hp, h = 15)