我是主题建模的新手,所以我会尽力描述我的问题。基本上,我想直观地检查构成我的主题模型中的主题的文档。我使用 stm 包中的以下代码来构建主题模型:
stm.35 <- stm(
dfm,
K = 35,
prevalence = NULL,
content = NULL,
data = NULL,
init.type = c("LDA"),
seed = 123,
emtol = 1e-05,
verbose = TRUE,
reportevery = 5,
LDAbeta = TRUE,
interactions = TRUE,
ngroups = 1,
model = NULL,
gamma.prior = c("Pooled"),
sigma.prior = 0,
kappa.prior = c("L1"),coefficients.
control = alpha (0.01)
)
这些文件是 Reddit 上的社交媒体评论。当我尝试使用“findThoughts”功能时,我得到这个:
Topic 1:
我读到我无法查看主题的原因是因为我使用了 Quanteda 的 dfm 来构建 stm。话虽这么说,有解决办法吗?或者我应该尝试使用 stm 对象而不是 quanteda dfm 构建我的模型?我宁愿不这样做,因为我发现使用 Quanteda 构建 dfm 取得了更大的成功。
谢谢你
我也遇到同样的问题。我正在用
thoughts1 <- findThoughts(stmM_15_k42,texts = corp_media, n = 2, topics = 6)
但是收到错误消息
Error in findThoughts(stmM_15_k42, texts = corp_media, n = 2, topics = 6) :
提供的文本数量和建模文档数量不匹配
我想原因是我对量子语料库进行了修剪和子集化,甚至删除了重复项。所以用于拟合模型的 DFM 与语料库不一样。