rlm() 和 lm_robust 之间的区别

问题描述 投票:0回答:1

由于异常值,我想使用稳健的回归方法而不是 lm()。

我无法决定是使用 lm_robust (estimatr 包)还是 rlm (MASS 包)。 这些函数之间存在数学差异吗? 您推荐哪一款?

r regression linear-regression robust
1个回答
0
投票

“稳健”是统计学中“精确”或“加权”等术语之一;它们同样适用于可能结果截然不同的方法。正如维基百科关于稳健回归的文章所解释的那样,至少有两个问题可能导致常规线性回归出错:

  • 异常值或高度影响的观测值,如果它们在拟合中或被排除在拟合之外,则由于其位置,它们对参数估计的影响比其他观测值大得多。
  • 缺乏方差齐性或同质性(所有误差均相同且独立分布,这是许多统计模型中的关键假设)。

其中每一个都有自己的补救措施,并且您提到的软件包实现了其中一些:

MASS::rlm
robustbase::lmrob
适合所谓的M-估计器,其可以具有比常规最大值更高的故障点(异常值的容差)似然估计器。
estimatr::lm_robust
更适合异方差一致方差,更广泛地说,是一个三明治(协)方差估计量,它放宽了同方差假设。

从您的评论来看,您的数据可能主要受到异常值的影响,因此

MASS::rlm
robustbase::lmrob
将是首先尝试的更好选择。此外,例如使用
sandwich
包,您可以获得适合 R 的许多不同类型模型的三明治协方差估计,因此组合可能会让您获得两者的最佳效果。

© www.soinside.com 2019 - 2024. All rights reserved.