lda 相关问题

Latent Dirichlet Allocation,LDA,是一种生成模型,它允许未观察到的组解释观察集,解释为什么数据的某些部分是相似的。

试图利用一个库来进行一些主题建模,但是进展不顺利

我有一个.csv术语文档矩阵,我想使用gensim在python中执行一些潜在的dirichlet分配。但是,我对Python或LDA并不是特别熟悉。我在gensim中发布了……

回答 1 投票 -1

试图利用一个库来进行一些主题建模,但是进展不顺利

我有一个.csv术语文档矩阵,我想使用gensim在python中执行一些潜在的dirichlet分配。但是,我对Python或LDA并不是特别熟悉。我在gensim中发布了……

回答 1 投票 0

在gensim LDA模型上失败的Scikit-Learn GridSearchCV

这是用于创建模型的代码:import gensim NUM_TOPICS = 4 ldamodel = gensim.models.ldamodel.LdaModel(corpus,num_topics = NUM _TOPICS,id2word = dictionary,passes = 100)ldamodel.save('model5 ....

回答 1 投票 0

Java Mallet LDA关键字分布

我已经使用Java-Mallet API通过LDA进行主题建模。该API产生以下结果:主题:keyword1(计数),keyword2(计数)例如,主题0:文件(12423),测试(3123)...主题1:...

回答 1 投票 0

将gensim LDA模型保存到ONNX

是否可以将gensim LDA模型保存为ONNX格式?我们需要能够使用Python / gensim进行训练,然后将其实现为Onnx模型以进行发布和使用。

回答 1 投票 0

主题建模:两个主题之间具有最大差异的单词的图形表示形式

在使用R进行文本挖掘中,介绍了对文档(例如博客文章或新闻文章)进行无监督分类的方法。这是主题建模的工作。我正在运行...

回答 1 投票 -1

是否可以为LDA语料库中的每个文档计算文档相似度?

我正在阅读有关LDA和文档相似性的笔记本:https://www.kaggle.com/ktattan/lda-and-document-similarity在此笔记本中,一小部分文档的文档相似性...

回答 1 投票 1

如何使用“ textmineR”包将R中通过LDA重试的主题分配给特定文档

我有787个文档(语音-文本文件)。使用“ textmineR”包,我得到了相同的主题。我有3个主题,如下所示:主题标签一致性流行性top_terms t_1 ...

回答 1 投票 0

在Windows上使用pip安装引导式LDA软件包

我正在尝试在Windows上pip安装guidelda。我安装了Microsoft Visual Studio,因为安装需要它。当我执行命令时,我得到Microsoft Visual Studio \\ 2019 \\ Community \\ VC \\ 14.24.28314 \\ ...

回答 1 投票 2

在LDA中指定词汇输入

我正在尝试了解如何在我的情况下使用LDA。我有很多文档,但是我想看看如何在各个主题之间分配一组非常具体的单词和语法。有没有办法...

回答 1 投票 0

Gensim Mallet:输出没有针对几个主题的术语

下面是我使用Gensim Mallet包装器得到的输出。从这个SO链接中,我了解到LL /令牌的意思是“模型的对数相似度除以令牌总数”。 1)但是,对于少数主题...

回答 1 投票 0

gensim LDAModel提前停止

Gensim LDAModel具有参数迭代和传递参数,以控制训练时期的数量,并通过回调获取有关收敛的信息,但是有可能在...

回答 1 投票 0

将gensim.interfaces.TransformedCorpus转换为可读结果

我正在使用带有Gensims实现的包装器的Mallet LDA。现在,我想获取几个看不见的文档的主题分布,将其存储在嵌套列表中,然后将其打印出来。这是我的代码:...

回答 1 投票 0

对数似然图以检测python中的lda主题数

我必须绘制对数似然图,我使用以下代码来检测主题数。但是会显示以下错误plt.figure(figsize =(20,5))plt.xticks(np.arange(2,11,1.0))plt.plot(...

回答 1 投票 0

如何并行化主题模型R包

我有一系列文档(〜50,000),已经转换为语料库,并且已经使用R中的topicmodels包构建了LDA对象。不幸的是,为了测试150多个主题,...

回答 2 投票 4

训练数据中的文档属于LDA中的特定主题

我正在研究一个文本数据包含大约10,000个文档的问题。我创建了一个应用程序,如果用户输入一些随机注释,它将显示所有类似的注释/文档...

回答 1 投票 0

为什么R将这个data.frame对象当作一个列表?

我正在尝试通过使用MASS包在R中将几个变量除以R中的其他缩放变量(此处未显示)而创建的data.frame上进行最小判别分析(lda())。下面...

回答 2 投票 1

输入矩阵的每一行都必须包含至少一个非零条目

[当我运行这段代码text_lda时遇到这个问题

回答 1 投票 1

gensim主题建模中的内存不足问题

我想在我非常庞大的语料库上成功运行LDAseq模型。我最终想从中提取100个主题。我在ldaseq模型的步骤中收到“内存不足”错误。这是因为我...

回答 1 投票 1

从词袋向量使用gensim创建LDA模型

我想根据Jstor提供的数据(例如https://www.jstor.org/dfr/about/sample-datasets)创建主题模型。但是,由于版权原因,它们不允许全文访问。相反,我可以...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.