我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。
例如:
ObjectID Left, Right, Top, Bottom
1 0 0 0 0
2 20 15 5 5
3 3 2 0 0
如何根据这4个属性对对象进行聚类?你推荐我的聚类算法/技术吗?
几乎所有的聚类算法都是多变量的,可以在这里使用。所以你的问题太宽泛了。
可能值得首先考虑适当的距离测量。
任何建议都是合理的,因为我们不知道您的数据是如何分配的。
根据数据类型和最终目标,您可以尝试k-means,k-modes或k-prototypes。如果您的数据混合了分类或连续变量,那么您可以尝试partition around medoids算法。但是,如前面另一个用户所述,您是否可以提供有关数据类型及其差异的更多信息。