与RMSE模型比较

问题描述 投票:0回答:1

我很牛逼的数据科学和想问的模型选择的帮助。

我已经建立了8个模型来预测工资VS年EXP,位置的名称和位置。接着,我试图通过RMSE至8款车型进行比较。但最后,我不知道哪种模式,我应该选择。 (米心,我更喜欢模型8,因为与随机森林测试后,结果比回归更好,那么我用所有的数据设置,使最终版本,但它更难以解释COEF比回归)你能帮助其模型你喜欢,为什么?而在现实中,做数据的科学家做的这样的过程或他们有自动的方式来处理?

1 RMSElm1:模型:线性回归,数据:列车80%,测试20%否任何插补= 22067.58

2个RMSElm2:模型:线性回归,数据:列车80%,测试20%:插补部分位置我认为它们给薪水的同样的想法= 22115.64

3 RMSElm3:模型:线性回归+逐步法,数据:列车80%,测试20%否任何插补= 22081.06

4 RMSEdeep1:模型:深学习(H2O包活化= '整流器',隐藏C(5,5),信号出现时间= 100,),数据:列车80%,测试20%:没有任何插补= 16265.13

5个RMSErf1:模型:随机森林(ntree = 10),数据:列车80%,测试20%否任何插补= 14669.92

6个RMSErf2:模型:随机森林(ntree = 500),数据:列车80%,测试20%否任何插补[1] 14669.92

RMSErf3 7:模型:随机森林(ntree = 10)数据:K倍10无任何插补[1] 14440.82

8 RMSErf4模型:随机森林(ntree = 10),数据:所有数据集没有任何插补[1] 13532.74

regression data-science random-forest data-science-experience model-comparison
1个回答
1
投票

在回归问题,MSE或RMSE是一种识别模型是如何好做。低RMSE或MSE是优选的。所以,去与给出最低MSE或RMSE值模型,并尝试测试数据。集成方法往往提供最好的结果。 XGBoost经常在比赛中使用。

可能有过学习,你可能会得到非常低的均方根误差在训练中的数据,但高RMSE测试数据的情况。因此,它被认为是使用交叉验证一个很好的做法。

您可能要检查它:https://stats.stackexchange.com/questions/56302/what-are-good-rmse-values

© www.soinside.com 2019 - 2024. All rights reserved.