即使我不想预测任何事情,我是否需要进行K-means聚类的测试分组?

问题描述 投票:0回答:2

我有一组2000点,基本上是来自协会足球的传球起源的x,y坐标。我想对它运行一个k-means聚类算法,只是对它进行分类,以获得最常见的10次传递(k = 10)。但是,我不想预测未来价值的任何要点。我只想使用现有数据。我是否还需要将其拆分为测试培训集?我假设只有当我们想要在特定集合上训练模型以计算未来值时才会完成它们(?)我不熟悉聚类(以及整个Python),所以任何帮助都会受到赞赏。

python-3.x machine-learning cluster-analysis k-means
2个回答
0
投票

不,在聚类(即无监督学习)中,您不需要拆分数据


0
投票

我不同意答案。群集具有作为度量的准确性。如果你没有将数据拆分成列车和测试,那么很可能你会过度拟合模型。看到这些类似的问题123。请注意,数据拆分到列车/测试集与监督或无监督问题无关。

热门问题
推荐问题
最新问题