低R-squared(R2)值是否表示回归分析不适合? [关闭]

问题描述 投票:-1回答:1

我尝试了两种不同的回归分析方法。

我对两种方法都使用相同的测试和训练数据。

1。方法1:

对总体进行简单线性回归。该模型的评估如下。Mean absolute error: 24.14 Residual sum of squares (MSE): 1030.12 R2-score: 0.69

2。方法2:

我将火车数据拆分为train1,train2。我还将测试分别分为test1,test2。然后,我将线性回归分别应用于它们两者。这些模型的评估如下: Test 1 Result Mean absolute error: 16.73 Residual sum of squares (MSE): 512.09 R2-score: 0.08 Test 2 Result Mean absolute error: 23.59 Residual sum of squares (MSE): 1108.97 R2-score: -0.40
因此,您可以看到MAE和MSE显着降低,但R2值也显着降低。哪种方法更好?为什么或为什么不呢?
python algorithm machine-learning regression data-science
1个回答
0
投票
MAE较低可能是由于数据点较少。 R2指标表示模型捕获测试数据方差的能力。因此,如果您进行的拆分使您的数据分布具有较低的方差,则该模型将适合数据点的平均值,而对方差不敏感。

第一种方法是训练模型的最常用方法。您还应该有一个额外的验证和测试集,以衡量模型的性能(或使用交叉验证)。

[一般来说,请记住,您拥有的数据越少,模型/度量的可靠性就越差(并非总是如此,但通常是这样)。

© www.soinside.com 2019 - 2024. All rights reserved.