半监督学习还是聚类?

问题描述 投票:0回答:0

我在做毕业设计时遇到了问题。我用很多变量标记了数据(在我的例子中 Y 是一个连续变量),当我进行预测时,我只有少量的变量可以使用(比如 5 或 6),所以当我想训练模型时我得到的标记数据的结果不够好,因为我将用于预测的数据的预测变量不多。我不确定如何进行?我会使用像聚类技术吗?或半监督学习?我对后一种学习的技术不是很熟悉,但我不认为这真的是我的用例。

我刚刚开始这个项目,我还没有真正尝试过很多数据,但如果你有任何有用的问题资源,我将非常感谢你的帮助。

python bigdata cluster-analysis semisupervised-learning
© www.soinside.com 2019 - 2024. All rights reserved.