topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

Java Mallet LDA关键字分布

我已经使用Java-Mallet API通过LDA进行主题建模。该API产生以下结果:主题:keyword1(计数),keyword2(计数)例如,主题0:文件(12423),测试(3123)...主题1:...

回答 1 投票 0

主题建模:两个主题之间具有最大差异的单词的图形表示形式

在使用R进行文本挖掘中,介绍了对文档(例如博客文章或新闻文章)进行无监督分类的方法。这是主题建模的工作。我正在运行...

回答 1 投票 -1

Gensim Mallet:输出没有针对几个主题的术语

下面是我使用Gensim Mallet包装器得到的输出。从这个SO链接中,我了解到LL /令牌的意思是“模型的对数相似度除以令牌总数”。 1)但是,对于少数主题...

回答 1 投票 0

使用对数似然比对不同的槌形主题模型?

[我正在尝试找出是否有可能-或最好的方法-比较用槌槌创建的编程上不同的主题模型,以确定给定语料库的“最佳”拟合模型。 ...

回答 1 投票 1

ValueError:islice()的Stop参数必须为None或整数:0 <= x <=主题一致性的sys.maxsize

按照本教程https://towardsdatascience.com/evaluate-topic-model-in-python-latent-dirichlet-allocation-lda-7d57484bb5d0查找问题。因此,我在此代码上进行迭代的目的是...

回答 1 投票 0

对数似然图以检测python中的lda主题数

我必须绘制对数似然图,我使用以下代码来检测主题数。但是会显示以下错误plt.figure(figsize =(20,5))plt.xticks(np.arange(2,11,1.0))plt.plot(...

回答 1 投票 0

如何并行化主题模型R包

我有一系列文档(〜50,000),已经转换为语料库,并且已经使用R中的topicmodels包构建了LDA对象。不幸的是,为了测试150多个主题,...

回答 2 投票 4

Python中的文本生成算法

我是Python机器学习的新手,是否有任何深度学习算法可以通过分析几篇文章来生成文本,并且涵盖了所有简短形式的文章,所以我使用文本分类和...

回答 1 投票 0

Mallet输出主题权重0.0或1.0,并且两者之间均不输出

因此,请按照开发人员指南中的此示例使用槌状API创建一个小程序。但是,我不了解最终的重量输出。程序运行时正在输出...

回答 1 投票 1

Watson SDK API的主题建模示例

我有一份清单,这些清单将在不同的时间在线上载。我没有有关内容的任何先前信息,我也没有有关可能的任何信息...

回答 1 投票 0

输入矩阵的每一行都必须包含至少一个非零条目

[当我运行这段代码text_lda时遇到这个问题

回答 1 投票 1

gensim主题建模中的内存不足问题

我想在我非常庞大的语料库上成功运行LDAseq模型。我最终想从中提取100个主题。我在ldaseq模型的步骤中收到“内存不足”错误。这是因为我...

回答 1 投票 1

从词袋向量使用gensim创建LDA模型

我想根据Jstor提供的数据(例如https://www.jstor.org/dfr/about/sample-datasets)创建主题模型。但是,由于版权原因,它们不允许全文访问。相反,我可以...

回答 1 投票 1

主题连贯性(gensim CoherenceModel)也是基于我的语料或外部数据吗?

我正在使用LDA对20世纪英语信函语料库进行建模,我一直在使用主题一致性(以及轮廓分数)来评估我的主题。我使用gensim的CoherenceModel ...

回答 1 投票 0

使用预定的主题分布初始化Gensim LDA模型

我们可以在确定新文档的主题时,使gensim lda模型使用预定主题分布吗?例如:import gensim texts = [['a','a','a'],['b','b','b'],['c','c','c']] d = gensim.corpora ....

回答 1 投票 0

使用Word2vec输出作为主题建模中LDA的输入

我已经阅读过,用于主题建模(从文本中提取可能的主题)的最常用技术是潜在Dirichlet分配(LDA)。但是最近我了解了另一种型号lda2vec。 ...

回答 1 投票 1

是否可以比较2个非监督模型?

我知道通常很难评估无监督模型。但是,由于我是NLP的新手,所以我想问一下是否可以比较两种主题模型。我有一个STM和LDA模型,...

回答 1 投票 0

使用textmineR的LDA模型中每个文档的主题标签

我正在使用textmineR使LDA模型适合类似于https://cran.r-project.org/web/packages/textmineR/vignettes/c_topic_modeling.html的文档。是否可以获取每个...的主题标签...

回答 1 投票 0

带有Mallet的主题建模-主题键输出参数

我对这里提出的问题有一个后续问题:槌主题建模-主题键输出参数,我希望我仍然能对此问题进行更详细的说明,因为我有麻烦...

回答 1 投票 0

通过Python用段落对书进行标记

我正在研究一个NLP项目,并试图按段落标记“大期望”,然后存储到列表中。为了执行一些无监督的学习主题模型,我需要这样做。 #...

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.