我是一个困惑的语言学家,试图使用R从Twitter收集数据。我一直在使用twitteR软件包,并且在固定字符串方面一直运行良好,但是我想请它获取包含“ querendo +不定式动词”的推文。在葡萄牙语中,不定式中的动词总是以字符“ r”结尾。我如何要求以特定字符结尾的单词?
searchtwitteR(" ", n = 1000, lang = pt, locate = Brazil)
有很多方法可以做到这一点。考虑words
作为向量
words <- c('rock', 'tempr', 'infinitr', 'end', 'twitter')
以R为基:
1)使用endsWith
words[endsWith(words, 'r')]
#[1] "tempr" "infinitr" "twitter"
2)使用grep
grep('r$', words, value = TRUE)
3)grepl
words[grepl('r$', words)]
使用stringr
:
library(stringr)
1)str_detect
words[str_detect(words, 'r$')]
2)str_subset
str_subset(words, 'r$')
我们可以使用stri_detect
中的stringi
library(stringi)
words[stri_detect(words, regex = 'r$')]
#[1] "tempr" "infinitr" "twitter"
或使用substring
中的base R
words[substring(words, nchar(words)) == 'r']
words <- c('rock', 'tempr', 'infinitr', 'end', 'twitter')