用于预测/估计给定变量趋势的输入数据

问题描述 投票:0回答:1

[与代码相关的问题可能更多是理论问题。在我目前的工作中,我发现自己正在估计/预测(最后一个是机会主义的)非洲特定河流的水位。

重点是,我正在开发一个简化的多元回归模型,该模型需要15年以上的历史水位和降水(来自不同位置)来生成水位估算。

我不是曾经使用过机器学习或其他正确的名字的人。我更习惯于对数据建模并生成拟合(可以使用不对称的高斯和S形函数以及低阶多项式完美地定义当前数据。

所以重点是;一旦有了多元回归模型,我的同事们建议我不要使用拟合的数据进行估算,而应使用所有原始数据。由于他们无法向我解释原因,因此我尝试将拟合的数据用作原始输入(以我的辩护,所有拟合模型的中位数具有非常低的偏差误差==很好的拟合)。但是我不明白的是,为什么我应该只使用原始数据,而这些数据却是嘈杂的,无意义的,并考虑到了不直接相关的因素(偏倚于回归?)。这有什么好处?

我在该领域缺乏理论知识,这使我对此感到疑惑。我应该总是使用所有原始数据来确定多元回归的变量,还是可以使用拟合值(即获取每个历史年度不同拟合模型的中位数)?

非常感谢!

python machine-learning linear-regression data-fitting model-fitting
1个回答
0
投票

这是我的2美分

[我认为您的同事说的是,因为这样一来,模型学习原始数据和实际降雨之间的相关关系会更好。

在现场,您将从原始数据开始,因此能够直接从原始数据进行预测非常有用。在原始数据完成工作之后,您需要做的工作更多,每次您要进行预测时都必须做。

但是,如果使用更简单的模型perfectly defined with asymetric gaussians and sigmoids functions combined with low order polynomials,则建议这样做。只要您的(y_pred-t_true)** 2非常小

© www.soinside.com 2019 - 2024. All rights reserved.