我在计算置信区间时遇到了一个有趣的现象。我将尝试通过生成具有正态分布的一组数字来复制该问题。
我使用两种方法来计算置信区间,但是,每种方法产生不同的结果。
## Generating a normal distribution
set.seed(1)
p <- data.frame(x = rnorm(1000))
## Method no. 1 for calculating CI.
p %>%
summarize(
lower = 0 - 2 * sd(x),
upper = 0 + 2 * sd(x)
)
## Method no. 2 for calc. CI.
p %>%
summarize(
lower = quantile(x, p = 0.025),
upper = quantile(x, p = 0.975)
)
第一种方法给出95%CI ,第二种给出
任何想法为何结果不同。我希望看到相同的结果。
2
是构造置信区间的经验法则,不是接近1.95的真实值。在第一种方法中使用它:
## Method no. 1 for calculating CI.
p %>%
summarize(
lower = 0 - qnorm(0.975) * sd(x),
upper = 0 + qnorm(0.975) * sd(x)
)
值将更接近