使用 svyglm 和 svydesign 与 R 进行多阶段分层集群设计

问题描述 投票:0回答:0

我有一个复杂的数据集,它是由多级分层集群设计的。我最初使用 glm 对此进行了分析,但现在意识到我必须使用 svyglm。我不太确定如何最好地利用 svyglm 对数据进行建模。我想知道是否有人可以帮助阐明一些问题。

我正在尝试查看时间 1 采取的各种协变量对时间 2 采取的二元结果的影响。

抽样策略为:州->城/乡->区->街道->村。在每个村庄内,随机选择个人,每个人都有一个 ID (uniqid)。

对于抽样策略的每个阶段,我在 df 中都有一个变量。我还有以下变量:结果、年龄、性别、收入、婚姻状况、urban_or_rural_area、uniqid、权重。我想要的回归方程的公式是 outcome ~ age + sex + income + marital_status + urban_or_rural_area 。权重由权重变量编码。我已经将家庭设置为二项式(link = logit)。

如果有人知道如何使用 svyglm 在 R 中编写这种方法,我将不胜感激。我很困惑应该输入什么作为 ID、fpc 和 nest。我必须指定分层设计的所有级别还是仅指定一些级别?

任何能很好地解释这一点的方向或资源将不胜感激。

r regression glm survey
© www.soinside.com 2019 - 2024. All rights reserved.