如果用名字列包含部分值，保持行

Question

我有一个数据集：

Camp1    Ade2    Camp3    Ade4    
   dA       1       eB       2
   dB       4       uC       8
   gB       3       NA      NA

如何子集数据集，其中如果有“营”，在名称的列名不包含值“A”或“B”或NA，排除那些行。

我知道如何做到这一点的完全匹配，但不偏。

cols = grepl("Camp", names(df))
rows = rowSums(df[, cols] == "A" | 
df[, cols] == "B" |
is.na(df[, cols])) == sum(cols)
df<-df[rows, ]

我该怎么做等价但部分匹配？

预期输出：

Camp1    Ade2    Camp3    Ade4    
   dA       1       eB       2
   gB       3       NA      NA

Answer 1

随着基础R你可以试试：

df_cols <- df[, grepl("Camp", names(df))]
df[apply(df_cols, 1, function(x) all(grepl("A|B", x) | is.na(x))), ]

  Camp1 Ade2 Camp3 Ade4
1    dA    1    eB    2
3    gB    3  <NA>   NA

在第一步中，它标识包含“营”在他们的名字，然后子集基于给定条件下的数据列。

Answer 2

我们可以使用filter_at从dplyr。使用starts_with辅助函数，我们将过滤器应用于所有以'Camp'开始列。在这些栏目中，我们筛选的地方all_vars包含A或B或NA行：

library(dplyr)

df %>%
  filter_at(vars(starts_with("Camp")), all_vars(grepl('A|B', .) | is.na(.)))

输出：

  Camp1 Ade2 Camp3 Ade4
1    dA    1    eB    2
2    gB    3  <NA>   NA

数据：

df <- structure(list(Camp1 = structure(1:3, .Label = c("dA", "dB", 
"gB"), class = "factor"), Ade2 = c(1L, 4L, 3L), Camp3 = structure(c(1L, 
2L, NA), .Label = c("eB", "uC"), class = "factor"), Ade4 = c(2L, 
8L, NA)), class = "data.frame", row.names = c(NA, -3L))

Answer 3

这里是一个tidyverse式的解决方案。

Using `filter_at`:

my_df %>%
    filter_at(vars(matches('Camp')), all_vars(is.na(.) | str_detect(., 'A|B')))

在这里，vars(matches('Camp'))说来筛选名称中包含字符串Camp列，而all_vars(...)说只保留行所有列[那场比赛“营”]满足规定的标准。

你将需要为这个工作做require(tidyverse)和require(stringr)。

如果用名字列包含部分值，保持行

问题描述投票：1回答：3

3个回答

Using `filter_at`:

最新问题

如果用名字列包含部分值，保持行

问题描述 投票：1回答：3

3个回答

Using filter_at:

最新问题

问题描述投票：1回答：3

Using `filter_at`: