str1<-" india hit milestone electricity wind solar"
其中包含的单词数为:
>sapply(strsplit(str1, " "), length) [1] 7
这是不正确的,因为我们在str1
的开头有一个空格。我试图修剪空白,但是:
> stripWhitespace(str1) # by tm package
返回相同情况:
[1] " india hit milestone electricity wind solar"
为什么?
trimws
sapply(strsplit(trimws(str1), " "), length)
[1] 6
lengths(gregexpr("\\b\\w+\\b",str1))
诸如此类
> lengths(gregexpr("\\b\\w+\\b",str1)) [1] 6
stringr::str_trim
和stringr::str_split
:length(stringr::str_split(stringr::str_trim(str1), pattern=" ", simplify=T))
str_count
library(stringr)
str_count(str1, '\\w+')
#[1] 6