我有一个看起来像这样的数据框
样品 | 价值 | 域名 |
---|---|---|
S1 | 12 | 域_已识别_X13_A |
S1 | 25 | 域名_已识别_X28_B |
S1 | 18 | 域名_未识别 |
我想聚合包含“Identified”字符串的行的值以获得最终的 df
样品 | 价值 | 域名 |
---|---|---|
S1 | 37 | 域_已识别 |
S1 | 18 | 域名_未识别 |
谢谢你
您可以为未识别的案例创建一个虚拟指标
df$dummy=ifelse(df$domain=="Domain_Unidentified",1,0)
然后使用 dplyr 跨组求和
library(dplyr)
df%>%
group_by(dummy)%>%
mutate(total_value=sum(value)