在标准偏差之间/之内

Question

当处理分层/多级/面板数据集时，采用一个返回可用变量的组内和组间标准差的包可能非常有用。

这是可以通过命令轻松完成Stata中以下数据的操作

xtsum, i(momid)

我进行了研究，但找不到任何可以执行此操作的R程序包。

编辑：

只是为了解决问题，分层数据集的示例可能是这样：

son_id mom_id hispanic mom_smoke son_birthweigth 1 1 1 1 3950 2 1 1 0 3890 3 1 1 0 3990 1 2 0 1 4200 2 2 0 1 4120 1 3 0 0 2975 2 3 0 1 2980

“多级”结构由每个母亲（较高级别）有两个或多个儿子（较低级别）的事实给出。因此，每个母亲都定义了一组观察结果。

因此，每个数据集变量可以在母亲之间和母亲内部变化，也可以仅在母亲之间变化。 birtweigth在母亲之间有所不同，但在同一母亲内也有所不同。而是将hispanic固定为同一位母亲。

例如，son_birthweigth的母亲内部方差是：

# mom1 means
    bwt_mean1 <- (3950+3890+3990)/3
    bwt_mean2 <- (4200+4120)/2
    bwt_mean3 <- (2975+2980)/2

# Within-mother variance for birthweigth
    ((3950-bwt_mean1)^2 + (3890-bwt_mean1)^2 + (3990-bwt_mean1)^2 + 
    (4200-bwt_mean2)^2 + (4120-bwt_mean2)^2 + 
    (2975-bwt_mean3)^2 + (2980-bwt_mean3)^2)/(7-1)
虽然母亲之间的差异是：

# overall mean of birthweigth:
# mean <- sum(data$son_birthweigth)/length(data$son_birthweigth)
    mean <- (3950+3890+3990+4200+4120+2975+2980)/7

# within variance:
    ((bwt_mean1-mean)^2 + (bwt_mean2-mean)^2 + (bwt_mean3-mean)^2)/(3-1)

当处理分层/多级/面板数据集时，采用一个返回可用变量的组内和组间标准差的包可能非常有用。这是...

Answer 1

我不知道您的stata命令应该复制什么，但要回答有关以下问题的第二部分分层结构，使用list即可轻松实现。例如，您定义这样的结构：

Answer 2

我知道这个问题已有四年了，但是最近我想在R中做同样的事情，并提出了以下函数。它取决于dplyr和tibble。其中：df是数据框，columns是将数据框作为子集的数值矢量，而persons是包含个体的列。

在标准偏差之间/之内

问题描述投票：6回答：2

2个回答

最新问题

在标准偏差之间/之内

问题描述 投票：6回答：2

2个回答

最新问题

问题描述投票：6回答：2