我有一个像下面这样的表:
date X1 X2 X3
1/1 0 3 34
2/1 0 7 65
3/1 0 13 0
4/1 25 4 65
5/1 35 0 0
6/1 4 6 9
7/1 0 0 0
只有在所有 X 开始出现非零值后,我才能使用
dplyr
选择行。在这种情况下,只选择日期 4/1
、5/1
、6/1
和 7/1
的行。谢谢。
df %>%
filter(cumsum(if_all(starts_with('X'), ~.x > 0))>0)
date X1 X2 X3
1 4/1 25 4 65
2 5/1 35 0 0
3 6/1 4 6 9
4 7/1 0 0 0
甚至:
df %>%
filter(cumsum(if_all(starts_with('X'))>0)>0)
date X1 X2 X3
1 4/1 25 4 65
2 5/1 35 0 0
3 6/1 4 6 9
4 7/1 0 0 0
您可以使用
cumsum
+ rowSums
> subset(df, cumsum(rowSums(df[-1] > 0) == length(df) - 1) > 0)
date X1 X2 X3
4 4/1 25 4 65
5 5/1 35 0 0
6 6/1 4 6 9
7 7/1 0 0 0
如果我正确理解问题:
df[apply(apply(df[, -1],
2, \(col) cumsum(col > 0)),
1, prod) > 0, ]
# date X1 X2 X3
# 4 4/1 25 4 65
# 5 5/1 35 0 0
# 6 6/1 4 6 9
# 7 7/1 0 0 0