目前,我正在解决以下问题:
我试图将我的数据集分组并创建一个新变量,捕获不属于该组的所有相反情况的组平均值 - 在特定的时间范围内。
这是使用mpg数据集的代码的副本。
cars <- mpg
cars$other_cty_yearly_mean <- 0
for(i in cars$cyl){
cars <- cars %>%
group_by(year) %>%
mutate(other_cty_yearly_mean = if_else(
cyl == i,
mean(cty[cyl != i]),
other_cty_yearly_mean
)) %>%
ungroup() %>%
as.data.frame()
}
有没有更好的方法不需要for循环?
谢谢,最好!
你可以使用map_dbl
的purrr
来转换你的for循环:
mpg %>%
group_by(year) %>%
mutate(other_cty_yearly_mean = map_dbl(cyl, ~ mean(cty[!cyl %in% .x])))
# A tibble: 234 x 12
# Groups: year [2]
# manufacturer model displ year cyl trans drv cty hwy fl class other_cty_yearly_mean
# <chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr> <dbl>
# 1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compact 14.6
# 2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compact 14.6
# 3 audi a4 2 2008 4 manual(m6) f 20 31 p compact 14.7
# 4 audi a4 2 2008 4 auto(av) f 21 30 p compact 14.7
# 5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compact 17.6
# ... with 229 more rows