如何在Spark中选择kMean集群作为新的Dataframe

问题描述 投票:0回答:1

我有一个包含几百万个条目的数据框,我使用了k-Means聚类,发现一个特定的集群与其他集群有着截然不同的中心。这很有趣。

如何选择属于此群集的条目以进一步调查它们?我们可以选择群集,因为每个群集都是自己的数据帧吗?

apache-spark cluster-analysis k-means apache-spark-mllib
1个回答
0
投票

你在使用Spark ML还是Spark MLLib?请参阅https://spark.apache.org/docs/latest/ml-clustering.html#k-means中的示例 - predictions对象包含您要查找的内容。

© www.soinside.com 2019 - 2024. All rights reserved.