是否有关于肘法中k值的最佳范围的研究？

我的主要问题是以某种方式定位k值的范围以执行弯头分析。目前，我只能想到2到min（num_rows，num_columns）之间的范围。还有没有其他更合适的最佳方法，特别是如果您的数据集包含大量的行和列吗？

P.S。，还有某种使它自动化的方法，这样我们就不必查看弯头图了吗？目前，我正在使用Kneed库的KneeLocator函数，但我想考虑更多选项。

谢谢。

python cluster-analysis k-means

0
投票

您可能知道，并不总是有“弯头”。即使有一个，也不一定代表最佳的群集数。

[Kneed的KneeLocator函数可能是最好的选择，因为它找到了具有最大曲率的K。