Latent Dirichlet Allocation,LDA,是一种生成模型,它允许未观察到的组解释观察集,解释为什么数据的某些部分是相似的。
我正在尝试对数据集进行主题建模。我遵循标准程序,清理数据,标记化,创建 dtm 并应用 LDA 函数(主题 <- tidy(my_topic_model, matrix = "...
Quanteda 的 lda 函数中的 set.seed()
每次运行此代码时,我都会得到不同的结果: 设置.种子(42) lda_seq <- textmodel_lda(dfmt, k = 5, gamma = 0.5, batch_size = 0.01, auto_iter = TRUE, verbose = FALSE) terms(lda_seq...
我是这方面的新手,所以如果我在这里问显而易见的问题,我深表歉意。我运行了双项主题建模算法来对短文本数据进行建模并发现其中的主题。我正在使用 LDAvis 包
我想要我的文档的主题分布。然而,Gensim 的 HDP 的 show_topic() 默认返回 20 个主题。我想他们不应该是最好的。深入挖掘后,我发现......
Gensim lda 给出负对数困惑值 - 这是正常的吗?我该如何解释它?
我目前正在使用 Gensim LDA 进行主题建模。 在调整超参数时,我发现该模型总是给出负对数困惑度 模特有这样的表现正常吗? (是吗……
有没有办法使用 R 获得独立的 html 版本的 serVis 视觉效果?
R 中的 LDAvis 包使用 LDA 和 serVis 函数创建主题建模分析的可视化。如果保存此可视化,您最终会得到一个包含 css 和 html 文件的文件夹。 ...
我正在尝试从大量短文本和相对少量的长文本中生成可比较的主题。目前,我将它们混合到一个语料库中来运行 LDA。我发现大多数主题...
给定文档单词列表,例如[['cow','boy','hat','mat],['village','boy','water','cow']....], gensim 可用于获取二元模型如下: 二元组 = gensim.models.Phrases(data_words, min_co...
我正在研究LDA降维技术,并将该技术应用于Iris数据集。 应用LDA后,我的4个特征减少到只有2个特征。 现在,我想知道什么...
我正在遵循LDA教程并输入以下代码 数据 = load_data("/home/export.json")["文本"] 打印(数据[0][0:90]) 但是,我收到以下错误混乱...
我正在尝试安装一个软件包(在我的例子中是guidelda),但安装不起作用。我输入 pip installguidelda 但收到以下错误消息 pip安装guidelda 收集gui...
我想在 Bybee、Leland 和 Kelly、Bryan T. 和 Manela、Asaf 和 Xiu、Da Cheng、《商业新闻和商业周期》(即将发表在《金融杂志》上)中应用“贝叶斯因子”方法。
我在 cm.glm 行遇到以下错误: 错误:数据和参考应该是同一水平的因素。 # 使用逻辑回归进行预测 pred.glm <- ifelse(predict(fit.glm, iri...
我目前正在使用PCA(主成分分析)和LDA(线性判别分析)。我了解两者的几何意义和工作过程。那我想找个ex...
请查看本文末尾的片段。 我使用 Quanteda 运行了主题建模的简化教程示例,但是一旦模型完成运行,我发现很难额外...
提到主题建模和自然语言处理中的“短文本”,短文本的长度定义是什么?
说到主题建模和自然语言处理中的“短文本”,短文本的定义到底是什么?我一直无法找到明确的答案。可以...
如何在 R 中使用 LDAvis 可视化种子 lda 模型?
我正在使用 R seededlda 包来训练种子 lda 模型。 textmodel_seedlda(dfmt, dict, 残差 = TRUE) https://github.com/koheiw/seededlda 我想知道是否有一种方法可以可视化 m...
无法使用 quanteda::dictionary() 定位字典
我终于在两周内几乎读完了整个 Quanteda 教程,现在我已经到达了 Seeded LDA 部分:https://tutorials.quanteda.io/machine-learning/topicmodel/ 此代码来自
Jupyter Notebook 无法导入 pyLDAvis.sklearn
我正在使用 Jupyter Notebook 来运行 python 代码。我已经做了以下事情: !pip 安装 pyldavis 我可以通过以下代码成功导入 pyLDAvis: 导入 pyLDAvis pyLDAvis.enable_note...
“BrokenProcessPool:任务未能反序列化。”运行 pyLDAvis.gensim 时出错
我正在尝试使用 pyLDAvis.gensim 可视化 lda 的结果。但是,我在运行 pyLDAvis.gensim 包时遇到了错误。当我执行代码时,我收到“BrokenProcessPoo ...