如何在rstudio中使用一定数量的元音对单词进行子集？

问题描述投票：0回答：1

我尝试使用rstudio中的str_subset函数对具有5个或更多元音字母的单词列表进行子集化。但是，无法想象。这个问题有什么建议吗？

r

1个回答

1
投票

由于您显然使用了stringr，因此str_count函数将为您提供所需的功能。假设您的“单词列表”表示单个单词的字符向量，以下应该可以解决问题。

testStrings <- c("Brillig", "slithey", "TOVES",
                 "Abominable", "EQUATION", "Multiplication", "aaagh")

VowelCount <- str_count(testString, pattern = "[AEIOUaeiou]")
OutputStrings <- testStrings[VowelCount >= 5]

方括号中的部分是一个正则表达式，与英语中的任何大写或小写元音相匹配。当然，其他语言有不同的元音集，您可能需要考虑这些元音。如果你想在基数R中做同样的事情，下面的单线程应该这样做：

OutputStrings <- grep("([AEIOUaeiou].*){5,}", testStrings, value = TRUE)

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.