如何找到k-means的k值?

问题描述 投票:1回答:1

我在数据集上使用k-means包括超过150k文件,但我不知道什么是良好的k值。我已经尝试过弯头方法来找到它,但惯性值并没有那么大变化。(我正在使用sklearn)。

这是chart of MSEs

python-3.x scikit-learn k-means
1个回答
1
投票

如果elbow方法没有明确的答案,那么可能没有多少簇特别好。 k-means只能模拟球形关系,这可能是有限的。您可以尝试其他功能表示,例如基于Word嵌入的内容。

对于文档分组任务,您可能希望使用主题建模方法而不是聚类,如Latent Dirichlet Allocation(LDA)或Non-negative Matrix factorization(NMF)。

© www.soinside.com 2019 - 2024. All rights reserved.