我正在尝试对财务数据进行一些回归,财务数据的一个问题是它往往有很多极端异常值,这些异常值可能不那么具有信息性。在 R 中,线性回归使用 RMSE 作为成本函数。我明白这一点,RMSE 对于回归更有用,因为它具有导数等。但它也倾向于比 MAE 更严重地惩罚异常值,MAE 对待所有值都是相等的。所以我想知道是否有任何参数可以传递给 lm/glm 来指示它使用 MAE 而不是 RMSE 作为成本函数?我可以想到一些替代的解决方法,通过绝对回报的倒数进行加权或应用变换,但如果我可以使用 MAE 进行回归,那就更好了。
搜索
R robust linear regression
引导我找到 rlm
包(R 中标准包含)中的 MASS
函数。我认为这是您解决方案的一个很好的起点。它不适用于 MAE,但我会阅读 rlm
如何执行稳健拟合(即拟合,同时不会受到异常值的过度影响)。
是的,尝试安装“robustbase”包,然后使用函数 lmrob.lar(x,y)。