R按结束值选择行

问题描述投票：1回答：2

data=data.frame("grade"=c(1, 2, 3, 1, 2, 3),
                "class"=c('a', 'a', 'a', 'b', 'b', 'b'),
                "size"=c(1, 1, 2, 2, 2, 1),
                "var"=c('q33', 'q35', 'q39', 'q33', 'q35', 'q39'),
                "score"=c(5, 8, 7, 3, 7, 5))

如果假设我希望对数据进行子集排除以'var'结尾为'5'的行，我该怎么做？希望的输出：

data1=data.frame("grade"=c(1, 3, 1, 3),
                "class"=c('a', 'a', 'b', 'b'),
                "size"=c(1,2, 2, 1),
                "var"=c('q33', 'q39', 'q33', 'q39'),
                "score"=c(5, 7, 3,  5))

r data.table gsub

2个回答

3
投票

我们可以将grepl与$一起使用以指定字符串的结尾

subset(data,  !grepl('5$', var))
#   grade class size var score
#1     1     a    1 q33     5
#3     3     a    2 q39     7
#4     1     b    2 q33     3
#6     3     b    1 q39     5

如果需要同时检查第一个和最后一个，请使用^指定开始位置>

subset(data, !grepl('^5|5$', var))
在这种情况下，起始字符不是数字，如果我们要检查数字的第一次出现，则>
subset(data, !grepl('\\D+5|5$', var))

正如@Frank所提到的，我们可以使用需要输入字符的内置endsWith。

subset(data, !endsWith(var, "5"))

#  grade class size var score
#1     1     a    1 q33     5
#3     3     a    2 q39     7
#4     1     b    2 q33     3
#6     3     b    1 q39     5

数据

data <- data.frame(grade=c(1, 2, 3, 1, 2, 3),
                   class=c('a', 'a', 'a', 'b', 'b', 'b'),
                   size=c(1, 1, 2, 2, 2, 1),
                   var=c('q33', 'q35', 'q39', 'q33', 'q35', 'q39'),
                   score=c(5, 8, 7, 3, 7, 5), stringsAsFactors = FALSE)

0
投票

正如@Frank所提到的，我们可以使用需要输入字符的内置endsWith。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.