我正在尝试获取变量的加权 n,但不知道如何在 Stata 中使用
svyset
来实现。
这就是我应用 svyset 的方式:
svyset final_cleaned_id [pweight = totalweight_max_low2], strata(final_urban_rural)
当我使用
svy : tab sex
时,我只能得到加权比例。对于性别,男性编码为 0,女性编码为 1。
有没有办法获得我的场景中的加权数字?我也愿意使用
svyset
以外的东西,因为我发现它的局限性令人沮丧。
如果您只想要计数,而不关心标准误差,您可以只使用频率权重:
tab sex [fw=totalweight_max_low2]
仅当权重为整数时才能使用频率权重。如果权重包含非整数,则将其四舍五入是很常见的做法:
gen roundweight = round(totalweight_max_low2)
tab sex [fw=roundweight]
您可能会发现阅读
help weight
很有帮助,其中有有用且清晰的文档。
在进行推理时,您需要非常小心使用哪种权重(因此需要标准误差等)。在您的推理案例中,您可能需要使用
svy
命令套件来考虑复杂的调查设计。然后,您可以尝试像 svy, subpop(sex): total sex
这样的命令来获取具有标准误差的女性总人口;然后为男性定义一个虚拟变量,并类似地运行 svy, subpop(male): total sex
以获得男性的总数。