模型精度很低。如何提高

问题描述 投票:-2回答:1

我有一个有大量缺失数据的模型。有大约20000条记录用于训练,5000条记录用于测试,模型的性能得到了验证。我已经确定了模型中基于某些特征的聚类,并在这些聚类中用中位数替换缺失值。所以大部分的缺失值都得到了处理。当我找不到聚类时,我将缺失值替换为零。我测试了这个模型的性能,randomforest,xgboosting似乎在这些数据上有几乎相似的性能。Xgboosting有0.5%的高准确率.我试着从RFE中选择最好的特征,发现这个模型最大的我可以获得80%。另外,我观察到训练精度是80%,验证精度是100%。我如何才能降低模型的过拟合度。我的缺失数据推算是否做错了?我知道模型的准确率可以达到90%。不知道我在这里做错了什么。应该怎么做才能提高我的准确率

machine-learning supervised-learning
1个回答
0
投票

更多的数据,特征选择,特征工程......。看看你的数据,填补缺失的字段,也许你会发现数据之间新的相关性。没有简单的答案。要有创意。

© www.soinside.com 2019 - 2024. All rights reserved.