我尝试使用rstudio中的str_subset函数对具有5个或更多元音字母的单词列表进行子集化。但是,无法想象。这个问题有什么建议吗?
由于您显然使用了stringr,因此str_count函数将为您提供所需的功能。假设您的“单词列表”表示单个单词的字符向量,以下应该可以解决问题。
testStrings <- c("Brillig", "slithey", "TOVES",
"Abominable", "EQUATION", "Multiplication", "aaagh")
VowelCount <- str_count(testString, pattern = "[AEIOUaeiou]")
OutputStrings <- testStrings[VowelCount >= 5]
方括号中的部分是一个正则表达式,与英语中的任何大写或小写元音相匹配。当然,其他语言有不同的元音集,您可能需要考虑这些元音。如果你想在基数R中做同样的事情,下面的单线程应该这样做:
OutputStrings <- grep("([AEIOUaeiou].*){5,}", testStrings, value = TRUE)