我有跨国家小组数据,我想知道IV
对二元学生成绩DV
的影响
我想包括一个嵌套的随机效应,考虑到学生所在的学校将影响结果,并且学校在不同国家有显着差异:(1|country/school)
。所以我开始的模型是:
model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')
我还想考虑时间趋势。起初我认为我应该做一年固定效果,但这些国家的政治发展随着时间的推移而有很大不同,我想要了解1991年可能让A国的学校陷入混乱,1991年可能是教育经费的好年景。在国家B.因此,我认为我应该包括国家年固定效应,如下所示:
model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')
该模型的随机效应是:
Random effects:
Groups Name Variance Std.Dev.
school:country (Intercept) 5.703e-02 2.388e-01
country (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups: school:country, 51; country, 22
当模型中已包含国家随机效应时,包含国家年固定效应是否不正确?
提出问题的另一种方式:我怎么可能应对school
是country
的子集这一事实,而country_year
是country
的一个子集,但school
或country_year
都不是彼此的子集?
从我所看到的,你有22个国家。目前尚不清楚country_year
是什么,但假设它只是country:year
的假人,那么将它作为一个固定的效果(作为一个因素)包括在内可能不是一个好主意,因为有太多的层次无法解释。
由于您对时间趋势感兴趣,因此将year
作为固定效果包含在内是有意义的:
DV ~ IV + (1|country/school) + as.factor(year)
如果有很多years
你可能会发现它最好包括年份数字
DV ~ IV + (1|country/school) + as.numeric(year)
..这将估计一年的单一(线性)趋势,而如果它是一个因子,那么它将计算一个估计,然而多年(减1),当有许多水平时,这将不容易解释。但是,当编码为因子时,估计值可以指示是否存在非线性趋势,然后您可以切换到as.numeric
并引入非线性项。
OP的最后一段有点令人困惑。如果country_year
真的嵌套在country
中,那么我们会:
DV ~ IV + (1|country/school) + (1|country:country_year)
..它是一样的:
DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)
......但是这不会估计任何时间趋势。如果你想估计一个趋势,那么你需要将year
(或country_year
)作为固定效果包含在上面 - 你可以通过将它作为一个随机斜率包括在学校(和/或国家)之间来区分它们,例如:
DV ~ IV + year + (1|country) + (year|school:country)