我的主要问题是以某种方式定位k值的范围以执行弯头分析。目前,我只能想到2到min(num_rows,num_columns)之间的范围。还有没有其他更合适的最佳方法,特别是如果您的数据集包含大量的行和列吗?
P.S。,还有某种使它自动化的方法,这样我们就不必查看弯头图了吗?目前,我正在使用Kneed库的KneeLocator函数,但我想考虑更多选项。
谢谢。
您可能知道,并不总是有“弯头”。即使有一个,也不一定代表最佳的群集数。
[Kneed的KneeLocator函数可能是最好的选择,因为它找到了具有最大曲率的K。