如何基于属性子集(4个属性)对数据进行聚类?

问题描述 投票:-1回答:2

我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。

例如:

ObjectID    Left, Right, Top, Bottom
1            0      0     0      0
2            20    15     5      5
3            3      2     0      0

如何根据这4个属性对对象进行聚类?你推荐我的聚类算法/技术吗?

python cluster-analysis data-mining data-analysis hierarchical-clustering
2个回答
0
投票

几乎所有的聚类算法都是多变量的,可以在这里使用。所以你的问题太宽泛了。

可能值得首先考虑适当的距离测量。

任何建议都是合理的,因为我们不知道您的数据是如何分配的。


0
投票

根据数据类型和最终目标,您可以尝试k-means,k-modes或k-prototypes。如果您的数据混合了分类或连续变量,那么您可以尝试partition around medoids算法。但是,如前面另一个用户所述,您是否可以提供有关数据类型及其差异的更多信息。

© www.soinside.com 2019 - 2024. All rights reserved.