计算R中数据帧中条件为1和0的列的行求和,想要0之间的连续1之间的和

问题描述 投票:1回答:2

输入数据帧可重现的示例:

onoff = c(0,1,1,1,0,0,1,1,1,0)数量= c(0,0.5,0,0.6,0,0,0.5,0.6,0.7,0)

mockdata = data.frame(onoff,数量)

看起来像这样。

picture of dataframe

我想对onoff在0到1之间的行的序列求和。因此,在此示例中,我将获得两组总和,第一组在2和4行之间,第二组在7和9行之间。因此,我将输出两个数字0.11和0.18。

不确定如何执行此操作,将不胜感激!谢谢:D

r sum aggregate subset subset-sum
2个回答
2
投票

我们可以使用rleid中的data.table创建一个分组列,然后使用该列来获得sum

library(dplyr)
library(data.table)
mockdata %>% 
   group_by(grp = rleid(onoff)) %>% 
   mutate(Sum = sum(amount) * onoff)
# A tibble: 10 x 4
# Groups:   grp [5]
#   onoff amount   grp   Sum
#   <dbl>  <dbl> <int> <dbl>
# 1     0    0       1   0  
# 2     1    0.5     2   1.1
# 3     1    0       2   1.1
# 4     1    0.6     2   1.1
# 5     0    0       3   0  
# 6     0    0       3   0  
# 7     1    0.5     4   1.8
# 8     1    0.6     4   1.8
# 9     1    0.7     4   1.8
#10     0    0       5   0  

如果我们需要汇总的输出

mockdata %>% 
  group_by(grp = rleid(onoff)) %>% 
  filter(onoff == 1) %>% 
  summarise(amount = sum(amount))

0
投票

使用基数R,我们可以使用rle创建组,并使用tapply计算汇总数据

with(rle(mockdata$onoff != 1), tapply(mockdata$amount, 
           rep(cumsum(values), lengths), sum))

#  1   2   3 
#1.1 1.8 0.0 

或者我认为更接近预期输出的另一种方法是使用onoff = 1过滤行>

mockdata$row <- seq_len(nrow(mockdata))
temp <- subset(mockdata, onoff == 1)
tapply(temp$amount, cumsum(c(TRUE, diff(temp$row) > 1)), sum)

#  1   2 
#1.1 1.8 
© www.soinside.com 2019 - 2024. All rights reserved.