我有一组N个对象,它们之间有N * N个距离。我想在子集上聚集这个集合,这样在每个集群中,所有对象都具有相同的距离,并且所有集群上的均值(cluster_size)都被最大化。
我尝试通过这样的算法解决这个任务:
有没有更有效的[近似]解决方案?
平均值(簇大小)=总点数/簇数
最大化这一点的唯一方法是最小化群集的数量。这似乎是一个相当糟糕的选择作为优化目标。您可能想重新考虑这个目标。
除此之外,我认为你的算法是相当明智的。由于问题可能是NP难,你确实想要使用贪婪的近似。
我建议在重新计算时更加懒惰,并添加一些界限。