为什么引导返回所有NA值

问题描述 投票:0回答:1

谁能告诉我为什么boot()会返回下面代码中的所有NA值?

library(boot)

diff.means.boot <- function(data, k) {

    m1 <- mean(subset(data, vs == 1)[k, "mpg"])
    m2 <- mean(subset(data, vs == 0)[k, "mpg"])

    return(m1-m2)

}

boot(data=mtcars, statistic=diff.means.boot, R=1000)
r mean difference resampling
1个回答
2
投票

在函数中使用subset通常是不明智的,但使用与数据对象的行数不同的向量进行索引更不明智。

boot函数传递一系列行名称的索引向量,这些行向名称已从完整数据集的“Universe”(采样帧)替换。而是在索引完成后使用“[”函数进行额外的子设置级别:

diff.means.boot <- function(data, k) {

    m1 <- mean(data[k, ][data$vs==1, "mpg"])
    m2 <- mean(data[k, ][data$vs==0, "mpg"])

    return(m1-m2)
}

在同一个电话之后:

# Bootstrap Statistics :
#     original    bias    std. error
# t1* 7.940476 -7.837067    2.079209
© www.soinside.com 2019 - 2024. All rights reserved.