计算不带空格的单词数[重复]

问题描述 投票:1回答:4
我有以下字符串:

str1<-" india hit milestone electricity wind solar"

其中包含的单词数为:

>sapply(strsplit(str1, " "), length) [1] 7

这是不正确的,因为我们在str1的开头有一个空格。我试图修剪空白,但是:

> stripWhitespace(str1) # by tm package

返回相同情况:

[1] " india hit milestone electricity wind solar"

为什么?
r string tm
4个回答
4
投票
您可以只使用基本功能trimws

sapply(strsplit(trimws(str1), " "), length) [1] 6


1
投票
也许您可以尝试

lengths(gregexpr("\\b\\w+\\b",str1))

诸如此类

> lengths(gregexpr("\\b\\w+\\b",str1)) [1] 6


0
投票
您可以尝试像这样使用stringr::str_trimstringr::str_split

length(stringr::str_split(stringr::str_trim(str1), pattern=" ", simplify=T))


0
投票
我们可以使用str_count

library(stringr) str_count(str1, '\\w+') #[1] 6

© www.soinside.com 2019 - 2024. All rights reserved.