是否有R函数用于选择以特定字符结尾的单词?

问题描述 投票:-2回答:2

我是一个困惑的语言学家,试图使用R从Twitter收集数据。我一直在使用twitteR软件包,并且在固定字符串方面一直运行良好,但是我想请它获取包含“ querendo +不定式动词”的推文。在葡萄牙语中,不定式中的动词总是以字符“ r”结尾。我如何要求以特定字符结尾的单词?

searchtwitteR(" ", n = 1000, lang = pt, locate = Brazil)
r linguistics
2个回答
2
投票

有很多方法可以做到这一点。考虑words作为向量

words <- c('rock', 'tempr', 'infinitr', 'end', 'twitter')

以R为基:

1)使用endsWith

words[endsWith(words, 'r')]
#[1] "tempr"    "infinitr" "twitter" 

2)使用grep

grep('r$', words, value = TRUE)

3)grepl

words[grepl('r$', words)]

使用stringr

library(stringr)

1)str_detect

words[str_detect(words, 'r$')]

2)str_subset

str_subset(words, 'r$')

0
投票

我们可以使用stri_detect中的stringi

library(stringi)
words[stri_detect(words, regex = 'r$')]
#[1] "tempr"    "infinitr" "twitter" 

或使用substring中的base R

words[substring(words, nchar(words)) == 'r']

数据

words <- c('rock', 'tempr', 'infinitr', 'end', 'twitter')
© www.soinside.com 2019 - 2024. All rights reserved.