我尝试了两种不同的回归分析方法。
我对两种方法都使用相同的测试和训练数据。
1。方法1:
对总体进行简单线性回归。该模型的评估如下。Mean absolute error: 24.14
Residual sum of squares (MSE): 1030.12
R2-score: 0.69
我将火车数据拆分为train1,train2。我还将测试分别分为test1,test2。然后,我将线性回归分别应用于它们两者。这些模型的评估如下:2。方法2:
Test 1 Result
Mean absolute error: 16.73
Residual sum of squares (MSE): 512.09
R2-score: 0.08
Test 2 Result
Mean absolute error: 23.59
Residual sum of squares (MSE): 1108.97
R2-score: -0.40
因此,您可以看到MAE和MSE显着降低,但R2值也显着降低。哪种方法更好?为什么或为什么不呢?
第一种方法是训练模型的最常用方法。您还应该有一个额外的验证和测试集,以衡量模型的性能(或使用交叉验证)。
[一般来说,请记住,您拥有的数据越少,模型/度量的可靠性就越差(并非总是如此,但通常是这样)。