主题建模:当使用 Quanteda dfm 对象制作主题模型时,如何“寻找想法”STM 功能?

问题描述 投票:0回答:1

我是主题建模的新手,所以我会尽力描述我的问题。基本上,我想直观地检查构成我的主题模型中的主题的文档。我使用 stm 包中的以下代码来构建主题模型:

stm.35 <- stm(
  dfm, 
  K = 35,
  prevalence = NULL,
  content = NULL,
  data = NULL,
  init.type = c("LDA"),
  seed = 123, 
  emtol = 1e-05,
  verbose = TRUE,
  reportevery = 5,
  LDAbeta = TRUE,
  interactions = TRUE,
  ngroups = 1,
  model = NULL,
  gamma.prior = c("Pooled"),
  sigma.prior = 0,
  kappa.prior = c("L1"),coefficients.
  control = alpha (0.01)
)

这些文件是 Reddit 上的社交媒体评论。当我尝试使用“findThoughts”功能时,我得到这个:

 Topic 1:

我读到我无法查看主题的原因是因为我使用了 Quanteda 的 dfm 来构建 stm。话虽这么说,有解决办法吗?或者我应该尝试使用 stm 对象而不是 quanteda dfm 构建我的模型?我宁愿不这样做,因为我发现使用 Quanteda 构建 dfm 取得了更大的成功。

谢谢你

r machine-learning topic-modeling quanteda
1个回答
0
投票

我也遇到同样的问题。我正在用

thoughts1 <- findThoughts(stmM_15_k42,texts = corp_media, n = 2, topics = 6)

但是收到错误消息

Error in findThoughts(stmM_15_k42, texts = corp_media, n = 2, topics = 6) : 

提供的文本数量和建模文档数量不匹配

我想原因是我对量子语料库进行了修剪和子集化,甚至删除了重复项。所以用于拟合模型的 DFM 与语料库不一样。

© www.soinside.com 2019 - 2024. All rights reserved.