如何在rstudio中使用一定数量的元音对单词进行子集?

问题描述 投票:0回答:1

我尝试使用rstudio中的str_subset函数对具有5个或更多元音字母的单词列表进行子集化。但是,无法想象。这个问题有什么建议吗?

r
1个回答
1
投票

由于您显然使用了stringr,因此str_count函数将为您提供所需的功能。假设您的“单词列表”表示单个单词的字符向量,以下应该可以解决问题。

testStrings <- c("Brillig", "slithey", "TOVES",
                 "Abominable", "EQUATION", "Multiplication", "aaagh")

VowelCount <- str_count(testString, pattern = "[AEIOUaeiou]")
OutputStrings <- testStrings[VowelCount >= 5]

方括号中的部分是一个正则表达式,与英语中的任何大写或小写元音相匹配。当然,其他语言有不同的元音集,您可能需要考虑这些元音。如果你想在基数R中做同样的事情,下面的单线程应该这样做:

OutputStrings <- grep("([AEIOUaeiou].*){5,}", testStrings, value = TRUE)
© www.soinside.com 2019 - 2024. All rights reserved.