使用 R 语言从存储在 Dataframe 中的文本中提取不同的主题标签“#”

问题描述投票：0回答：0

我有一个包含一些推文的数据框，我想使用 tidytext 包的 unnest_tokens() 函数从推文中提取主题标签，创建一个每个主题标签一行的标记化数据框。

我的数据只有 3 列：

Fecha：这是 POSIXct 变量类型中推文的日期。
Usuario：这是数字变量类型的推文的用户id。
Texto：这是字符变量类型中推文的文本。

otros_numerales_numeral_petro  <- Numeral_Petro_sin_emojis %>% 
unnest_tokens(output = "hashtag", input = "Texto", token = "tweets") %>%
filter(str_starts(hashtag, "#"))

但是，当我运行代码时出现此错误：

错误：！在 tidytext 中弃用了对
token = "tweets"
的支持 0.4.0 现在已经不存在了。

有人可以帮我解决这个问题吗？

twitter

tweets

tidytext

使用 R 语言从存储在 Dataframe 中的文本中提取不同的主题标签“#”

问题描述 投票：0回答：0

最新问题

问题描述投票：0回答：0