我已经对我的数据进行了准泊松 GLM 并简化了我的模型,但是当我查看摘要时,我可以看到我的一个变量(月份)出现了 NA。这个变量是一个字符,但是我的其他一些变量也是一个字符,这并没有引起任何问题。
有谁知道为什么这个变量可能会出现为 NA 以及如何修复它?
数据集
日期 | DOY | 月 | 物种 | 数量 | 选花 |
---|---|---|---|---|---|
2020年7月13日 | 195 | 7月20日 | B 卢科鲁姆 | 13 | 薰衣草 |
2020年7月13日 | 195 | 7月20日 | B 拉皮达琉斯 | 1 | 马鞭草 |
2020年7月13日 | 195 | 7月20日 | B 土星 | 3 | 矢车菊 |
2020年7月13日 | 195 | 7月20日 | B 帕斯科鲁姆 | 1 | 野豌豆 |
2020年7月13日 | 195 | 7月20日 | B 拉皮达琉斯 | 7 | 法尔西莉亚 |
2020年7月13日 | 195 | 7月20日 | B 土星 | 4 | 薰衣草 |
2020年7月13日 | 195 | 7月20日 | B 土星 | 9 | 马鞭草 |
2020年7月13日 | 195 | 7月20日 | B 拉皮达琉斯 | 1 | 法尔塞莉亚 |
2020年7月13日 | 195 | 7月20日 | B 卢科鲁姆 | 3 | 薰衣草 |
g1 <- glm(Quantity ~ Location + Recorder + Species + Flower.selection + Date + Month,
family = quasipoisson(),
data = BW)
g3<-update(g2,~.-Recorder, family = quasipoisson())
summary(g3)
来自
summary(g3)
的结果示例:
MonthSep-20 NA NA NA NA
MonthMar-21 NA NA NA NA
MonthApr-21 NA NA NA NA
MonthMay-21 NA NA NA NA
MonthJun-21 NA NA NA NA
MonthJul-21 NA NA NA NA
Date
和 Month
是模型中的冗余预测变量:一旦您知道日期,月份就已完全指定(因此将月份添加到模型中不会添加任何信息)。冗余/共线参数会扰乱内部用于计算的线性代数,因此它们被省略/分配 NA
值。
您可以省略其中一个,或者使用以月份和日期作为随机效应分组变量的混合模型(日期嵌套在月份内)[尽管根据您使用的包,
family = "quasipoisson"
可能不可用:请参阅 GLMM 常见问题解答的相关部分,了解替代方案]