R中的组中位数

问题描述 投票:0回答:2

我有以下数据框,并且如果值大于组的中位数,则想引入一个虚拟对象。

df<-data.frame(group=rep(c("A","B","c"),3), value1=c(1:9))
m<-aggregate(. ~ group, data=df, FUN=median)
names(m)[2]<-"median"
df<-merge(df,m, by="group", all.x = T)
df$median_0_1<-ifelse(df$median<df$value1,1,0)

是否有更优雅的方法可以做到这一点?

而且,我可以调整它以将虚拟对象设置为高于或低于第三四分位数吗?

而且,这是一种可靠的方法,将可靠地工作吗?

非常感谢。

r group-by median base
2个回答
2
投票

当您要保持数据框中的行数相同时,请使用ave

df$median_0_1 <- with(df, as.integer(value1 > ave(value1, group, FUN = median)))

这也可以用dplyr完成

library(dplyr)
df %>% group_by(group) %>% mutate(median_0_1 = as.integer(value1 > median(value1)))

data.table

library(data.table)
setDT(df)[, median_0_1 := as.integer(value1 > median(value1)), group]

0
投票

优雅在于情人的眼中,但您对此感觉如何。

df <- within(df, {
  median <- ave(value1, group)
  median_0_1 <- ifelse(median < value1, 1, 0)
  quantile3 <- ave(value1, group, FUN=function(x) quantile(x, probs=.3))
  quantile_0_1 <- ifelse(quantile3 < value1, 1, 0)
})
df
#   group value1 quantile_0_1 quantile3 median_0_1 median
# 1     A      1            0       2.8          0      4
# 2     B      2            0       3.8          0      5
# 3     c      3            0       4.8          0      6
# 4     A      4            1       2.8          0      4
# 5     B      5            1       3.8          0      5
# 6     c      6            1       4.8          0      6
# 7     A      7            1       2.8          1      4
# 8     B      8            1       3.8          1      5
# 9     c      9            1       4.8          1      6
© www.soinside.com 2019 - 2024. All rights reserved.