由于异常值,我想使用稳健的回归方法而不是 lm()。
我无法决定是使用 lm_robust (estimatr 包)还是 rlm (MASS 包)。 这些函数之间存在数学差异吗? 您推荐哪一款?
“稳健”是统计学中“精确”或“加权”等术语之一;它们同样适用于可能结果截然不同的方法。正如维基百科关于稳健回归的文章所解释的那样,至少有两个问题可能导致常规线性回归出错:
其中每一个都有自己的补救措施,并且您提到的软件包实现了其中一些:
MASS::rlm
和robustbase::lmrob
适合所谓的M-估计器,其可以具有比常规最大值更高的故障点(异常值的容差)似然估计器。 estimatr::lm_robust
更适合异方差一致方差,更广泛地说,是一个三明治(协)方差估计量,它放宽了同方差假设。
从您的评论来看,您的数据可能主要受到异常值的影响,因此
MASS::rlm
或 robustbase::lmrob
将是首先尝试的更好选择。此外,例如使用 sandwich
包,您可以获得适合 R 的许多不同类型模型的三明治协方差估计,因此组合可能会让您获得两者的最佳效果。