获得每个分类变量的lm估计值

问题描述 投票:2回答:1

因此,我正在进行多元线性回归,以确定岩石中的裂缝密度和岩石类型是否会影响退缩率。

retreat <- lm(retreat_rate ~ fracture_dens + rock_unit, data = coast)
> summary(retreat)

我希望它将'rock_unit'视为一个类别。我在矢量中有两种岩石类型。这是我目前的结果。

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)          -0.22631    0.53806  -0.421 0.676353    
fracture_dens         0.11467    0.02704   4.241 0.000132 ***
rock_unitSC_mudstone  1.73490    0.36097   4.806  2.3e-05 ***

我希望有'SC_mudstone'和'Purisima'(另一种摇滚类型)而不是它现在给我的'rock_unitSC_mudstone'。

r regression lm
1个回答
2
投票

这是线性模型的典型结果:变量rock_unitSC_mudstone是一个虚拟变量,定义为:

如果rock unit = SC_mudstone则为rock_unitSC_mudstone = 1,否则为0。

添加另一个变量rock_unitPurisima会导致模型矩阵$ X $没有完全排名。

无论如何,你不需要rock_unitPurisima变量。您可以按如下方式解释结果:

SC_mudstone的平均撤退率= -0.22631 + 1.73490 Purisima的平均撤退率= -0.22631

如果你坚持使用变量rock_unitPurisimayou可以将截距设置为零:

retreat2 <- lm(retreat_rate ~ 0 + fracture_dens + rock_unit, data = coast)

但正如我所说,拦截和两个虚拟变量只会包含太多信息。

希望这有用。

© www.soinside.com 2019 - 2024. All rights reserved.