topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

结构主题建模(stm)makeTopMatrix中的错误(普遍性,数据):创建模型矩阵时出错

我正在尝试使用此数据集运行此stm教程https://github.com/dondealban/learning-stm的初始步骤,它是原始数据集的一部分http://www.mediafire.com/file/1jk2aoz4ac84jn6 / ...

回答 1 投票 0

aggregate.data.frame(as.data.frame(x),...)中的错误:参数必须具有相同的长度

嗨,我正在使用本教程中的最后一个示例:主题比例随着时间的推移。 https://tm4ss.github.io/docs/Tutorial_6_Topic_Models.html我用这个代码库(readxl)为我的数据运行它...

回答 1 投票 0

使用单个协变量为主题建模运行stm的问题

我正在尝试使用stm运行LDA主题建模分析,但是我的元数据有问题,它似乎工作正常,但我有一个协方差(Age),如本示例所示,未被读取。一世 ...

回答 1 投票 0

绘制每个组的主题流行率[结构主题模型R]

社区,我对R的STM包有疑问,希望你能帮我找到答案。在小插图的图7中,作者提供了一个图表,其中主题流行(对...

回答 1 投票 0

使用LDA(主题模型):每个主题在单词上的分布是相似的并且“平坦”

Latent Dirichlet Allocation(LDA)是一个主题模型,用于查找一堆文档的潜在变量(主题)。我正在使用python gensim包并且有两个问题:我打印出最多......

回答 1 投票 6

主题建模,但已知主题?

好的,通常主题模型(例如LDA,pLSI等)用于以无人监督的方式推断可能存在于一组文档中的主题。我想知道是否有人有任何想法......

回答 2 投票 4

潜在Dirichlet分配的时间复杂度

在文档数量(D),主题(T),文档平均长度(L)和单词(W)方面,Latent Dirichlet Allocation的计算复杂度是多少?

回答 1 投票 -3

如何将Sklearn lda模型输出保存到csv?

如何将Sklearn LDA模型输出保存到csv?它没有show_topics命令作为genism lDA模型。 def selected_topics(model,vectorizer,top_n = 10):对于idx,枚举中的主题(模型....

回答 3 投票 0

为什么LDA预测不正确

步骤1我正在使用R和“topicmodels”包从4.5k文档语料库中构建LDA模型。我做了通常的预处理步骤(停用词,削减低/高字频率,词形还原)和......

回答 1 投票 2

使用gensim了解LDA实现

我试图了解Python中的gensim包如何实现Latent Dirichlet Allocation。我正在做以下事情:定义数据集文档= [“Apple正在发布新产品”,...

回答 5 投票 25

结构主题模型(stm包)使用绘图函数绘制百分比值

在stm教程的第18页https://cran.r-project.org/web/packages/stm/vignettes/stmVignette.pdf中,预期的主题比例是绘制的图(poliblogPrevFit,type =“summary”,xlim = c( 0,....

回答 1 投票 0

pyspark LDA在主题中获得单词

我正在尝试运行LDA。我不是将它应用于文字和文档,而是错误消息和错误原因。每行都是错误,每列都是错误原因。如果错误原因处于活动状态,则单元格为1,...

回答 1 投票 1

如何从短文本文档中提取类别?

我的数据包含开放式问题的答案:推荐您所在组织的原因是什么?我想使用一种算法/技术,使用这些数据,学习...

回答 1 投票 -2

如何比较LDA与其他主题模型?

我对主题建模领域感兴趣,我即将开发自己的算法。我目前面临的问题是如何将我的工作成果与状态结果进行比较。

回答 1 投票 0

如何在python主题建模中处理不同序列中同一个单词的双字母?防爆。 '租约延期'和'延期租赁'

你好Stackoverflow社区,我正在与大家联系,了解如何在python主题建模中以不同的顺序处理同一个单词的bigrams。我有一个主题模型,其中两个......

回答 1 投票 0

使Mallet主题建模稳定

我正在使用mallet主题建模工具并且有一些困难使它稳定(我得到的主题似乎不是很逻辑)。我使用了你的教程和那个:https:// ...

回答 1 投票 0

为每个主题添加单词LDA

我正在使用Gensim在python中构建LDA,我正在努力增加每个主题打印的单词数量,默认值为10.我想要20个主题,每个主题30个单词。任何建议都是......

回答 1 投票 0

LDA主题模型性能 - 用于scikit-learn的主题一致性实现

我有一个关于测量/计算scikit-learn中构建的LDA模型的主题一致性的问题。主题一致性是衡量给定LDA主题的人类可解释性的有用指标......

回答 2 投票 4

R stm包错误:“向量化的源必须具有正长度条目”

我想我犯了一个非常简单的错误,但我是R的新秀,我很难搞清楚。我正在尝试使用R中的'stm'包对推文数据集进行一些主题建模我...

回答 1 投票 1

如何在gensim中使用mallet设置主题模型的随机种子?

我一直试图通过使用mallet作为gensim中的库来保持主题建模的输出稳定。但是,我发现槌可以设置随机种子,但我没有在gensim中看到任何参数...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.