R中基于行非零值的过滤表

问题描述 投票:0回答:3

我有一个像下面这样的表:

date X1 X2 X3
1/1   0  3 34 
2/1   0  7 65
3/1   0 13  0
4/1  25  4 65
5/1  35  0  0
6/1   4  6  9
7/1   0  0  0

只有在所有 X 开始出现非零值后,我才能使用

dplyr
选择行。在这种情况下,只选择日期
4/1
5/1
6/1
7/1
的行。谢谢。

r dplyr filter filtering subset
3个回答
3
投票
df %>%
   filter(cumsum(if_all(starts_with('X'), ~.x > 0))>0)

  date X1 X2 X3
1  4/1 25  4 65
2  5/1 35  0  0
3  6/1  4  6  9
4  7/1  0  0  0

甚至:

df %>%
   filter(cumsum(if_all(starts_with('X'))>0)>0)

  date X1 X2 X3
1  4/1 25  4 65
2  5/1 35  0  0
3  6/1  4  6  9
4  7/1  0  0  0

3
投票

您可以使用

cumsum
+
rowSums

> subset(df, cumsum(rowSums(df[-1] > 0) == length(df) - 1) > 0)
  date X1 X2 X3
4  4/1 25  4 65
5  5/1 35  0  0
6  6/1  4  6  9
7  7/1  0  0  0

1
投票

如果我正确理解问题:

df[apply(apply(df[, -1], 
               2, \(col) cumsum(col > 0)), 
         1, prod) > 0, ]

#   date X1 X2 X3
# 4  4/1 25  4 65
# 5  5/1 35  0  0
# 6  6/1  4  6  9
# 7  7/1  0  0  0
© www.soinside.com 2019 - 2024. All rights reserved.