谁能告诉我为什么boot()
会返回下面代码中的所有NA值?
library(boot)
diff.means.boot <- function(data, k) {
m1 <- mean(subset(data, vs == 1)[k, "mpg"])
m2 <- mean(subset(data, vs == 0)[k, "mpg"])
return(m1-m2)
}
boot(data=mtcars, statistic=diff.means.boot, R=1000)
在函数中使用subset
通常是不明智的,但使用与数据对象的行数不同的向量进行索引更不明智。
boot
函数传递一系列行名称的索引向量,这些行向名称已从完整数据集的“Universe”(采样帧)替换。而是在索引完成后使用“[”函数进行额外的子设置级别:
diff.means.boot <- function(data, k) {
m1 <- mean(data[k, ][data$vs==1, "mpg"])
m2 <- mean(data[k, ][data$vs==0, "mpg"])
return(m1-m2)
}
在同一个电话之后:
# Bootstrap Statistics :
# original bias std. error
# t1* 7.940476 -7.837067 2.079209