在标准偏差之间/之内

问题描述 投票:6回答:2

当处理分层/多级/面板数据集时,采用一个返回可用变量的组内和组间标准差的包可能非常有用。

这是可以通过命令轻松完成Stata中以下数据的操作

xtsum, i(momid)

我进行了研究,但找不到任何可以执行此操作的R程序包。

编辑:

只是为了解决问题,分层数据集的示例可能是这样:

son_id       mom_id      hispanic     mom_smoke     son_birthweigth

  1            1            1            1              3950
  2            1            1            0              3890
  3            1            1            0              3990
  1            2            0            1              4200
  2            2            0            1              4120
  1            3            0            0              2975
  2            3            0            1              2980

“多级”结构由每个母亲(较高级别)有两个或多个儿子(较低级别)的事实给出。因此,每个母亲都定义了一组观察结果。

因此,每个数据集变量可以在母亲之间和母亲内部变化,也可以仅在母亲之间变化。 birtweigth在母亲之间有所不同,但在同一母亲内也有所不同。而是将hispanic固定为同一位母亲。

例如,son_birthweigth的母亲内部方差是:

# mom1 means
    bwt_mean1 <- (3950+3890+3990)/3
    bwt_mean2 <- (4200+4120)/2
    bwt_mean3 <- (2975+2980)/2

# Within-mother variance for birthweigth
    ((3950-bwt_mean1)^2 + (3890-bwt_mean1)^2 + (3990-bwt_mean1)^2 + 
    (4200-bwt_mean2)^2 + (4120-bwt_mean2)^2 + 
    (2975-bwt_mean3)^2 + (2980-bwt_mean3)^2)/(7-1)

虽然母亲之间的差异是:

# overall mean of birthweigth:
# mean <- sum(data$son_birthweigth)/length(data$son_birthweigth)
    mean <- (3950+3890+3990+4200+4120+2975+2980)/7

# within variance:
    ((bwt_mean1-mean)^2 + (bwt_mean2-mean)^2 + (bwt_mean3-mean)^2)/(3-1)

当处理分层/多级/面板数据集时,采用一个返回可用变量的组内和组间标准差的包可能非常有用。这是...

r hierarchical-data stata multi-level
2个回答
1
投票

我不知道您的stata命令应该复制什么,但要回答有关以下问题的第二部分分层结构,使用list即可轻松实现。例如,您定义这样的结构:


1
投票

我知道这个问题已有四年了,但是最近我想在R中做同样的事情,并提出了以下函数。它取决于dplyrtibble。其中:df是数据框,columns是将数据框作为子集的数值矢量,而persons是包含个体的列。

© www.soinside.com 2019 - 2024. All rights reserved.