使用 R 语言从存储在 Dataframe 中的文本中提取不同的主题标签“#”

问题描述 投票:0回答:0

我有一个包含一些推文的数据框,我想使用 tidytext 包的 unnest_tokens() 函数从推文中提取主题标签,创建一个每个主题标签一行的标记化数据框。

我的数据只有 3 列:

  1. Fecha:这是 POSIXct 变量类型中推文的日期。
  2. Usuario:这是数字变量类型的推文的用户id。
  3. Texto:这是字符变量类型中推文的文本。

otros_numerales_numeral_petro  <- Numeral_Petro_sin_emojis %>% 
unnest_tokens(output = "hashtag", input = "Texto", token = "tweets") %>%
filter(str_starts(hashtag, "#"))

但是,当我运行代码时出现此错误:

错误: !在 tidytext 中弃用了对

token = "tweets"
的支持 0.4.0 现在已经不存在了。

有人可以帮我解决这个问题吗?

r twitter tweets tidytext
© www.soinside.com 2019 - 2024. All rights reserved.