因此,我正在进行多元线性回归,以确定岩石中的裂缝密度和岩石类型是否会影响退缩率。
retreat <- lm(retreat_rate ~ fracture_dens + rock_unit, data = coast)
> summary(retreat)
我希望它将'rock_unit'视为一个类别。我在矢量中有两种岩石类型。这是我目前的结果。
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.22631 0.53806 -0.421 0.676353
fracture_dens 0.11467 0.02704 4.241 0.000132 ***
rock_unitSC_mudstone 1.73490 0.36097 4.806 2.3e-05 ***
我希望有'SC_mudstone'和'Purisima'(另一种摇滚类型)而不是它现在给我的'rock_unitSC_mudstone'。
这是线性模型的典型结果:变量rock_unitSC_mudstone
是一个虚拟变量,定义为:
如果rock unit = SC_mudstone则为rock_unitSC_mudstone = 1,否则为0。
添加另一个变量rock_unitPurisima
会导致模型矩阵$ X $没有完全排名。
无论如何,你不需要rock_unitPurisima
变量。您可以按如下方式解释结果:
SC_mudstone的平均撤退率= -0.22631 + 1.73490 Purisima的平均撤退率= -0.22631
如果你坚持使用变量rock_unitPurisima
you可以将截距设置为零:
retreat2 <- lm(retreat_rate ~ 0 + fracture_dens + rock_unit, data = coast)
但正如我所说,拦截和两个虚拟变量只会包含太多信息。
希望这有用。