lda 相关问题

Latent Dirichlet Allocation,LDA,是一种生成模型,它允许未观察到的组解释观察集,解释为什么数据的某些部分是相似的。

在LDA中应用fit_transform时输入形状不正确

我在我的数据集上应用了get_dummies()方法之后,当我尝试应用它输出的LDA的fit_transform()方法时,为了训练和测试目的而拆分数据集:ValueError:bad ...

回答 1 投票 1

如何在训练Mallet LDA之前将文档细分为句子

在训练MALLET LDA之前,你们有什么建议我可以将文件细分为句子吗?先感谢您

回答 3 投票 1

如何确定LDA的主题数量?

我是LDA的新生,我想在我的工作中使用它。但是,出现了一些问题。为了获得最佳性能,我想估算最佳主题编号。看完“发现......

回答 4 投票 11

如何在gensim中获取LDA模型中的主题编号

我在text_corpus上使用gensim训练了LDA模型。 > lda_model = gensim.models.ldamodel.LdaModel(text_corpus,10)现在,如果必须推断出新的文本文档text_sparse_vector,我必须做...

回答 3 投票 1

pyspark LDA在主题中获得单词

我正在尝试运行LDA。我不是将它应用于文字和文档,而是错误消息和错误原因。每行都是错误,每列都是错误原因。如果错误原因处于活动状态,则单元格为1,...

回答 1 投票 1

LDA Mallet CalledProcessError

我正在尝试实现以下代码:import os os.environ.update({'MALLET_HOME':r'c:/mallet-2.0.8/'})mallet_path ='C:\\ mallet-2.0.8 \\ bin \\ mallet'ldmamallet = gensim.models.wrappers ....

回答 1 投票 1

使用Gensim或其他python LDA包来使用Mallet中经过培训的LDA模型

我有一个通过Java中的Mallet训练的LDA模型。从Mallet LDA模型生成三个文件,这允许我从文件运行模型并推断新文本的主题分布。现在......

回答 1 投票 3

插入符号虚拟vars排除目标

如何在不破坏目标变量的情况下在插入符号中使用虚拟变量? set.seed(5)数据

回答 1 投票 0

如何在python主题建模中处理不同序列中同一个单词的双字母?防爆。 '租约延期'和'延期租赁'

你好Stackoverflow社区,我正在与大家联系,了解如何在python主题建模中以不同的顺序处理同一个单词的bigrams。我有一个主题模型,其中两个......

回答 1 投票 0

LDA模型可以用于句子(而非文档)聚类/分类吗?

最近,我正在研究句子分类问题,这些句子只不过是关于产品和客户的一两条评论,那里有关于产品的各种功能的反馈...

回答 3 投票 -1

为每个主题添加单词LDA

我正在使用Gensim在python中构建LDA,我正在努力增加每个主题打印的单词数量,默认值为10.我想要20个主题,每个主题30个单词。任何建议都是......

回答 1 投票 0

具有大型语料库的Python Gensim LDAMallet CalledProcessError(小型语料库运行良好)

当我在大约1600万个文档的完整语料库中运行Gensim LDAMallet模型时,我得到一个CalledProcessError“非零退出状态1”错误。有趣的是,如果我在...上运行完全相同的代码

回答 1 投票 1

用LDA算法的python代码不太清楚

我正在尝试使用python与Gensim实现Latent Dirichlet Allocation(LDA),我也是从网站引用LDA代码,但我仍然不太清楚LDA python代码。有人可以......

回答 1 投票 3

通过限制语料库文档的字大小来进行潜在Dirichlet分配(LDA)性能

我一直在使用python(gensim包)中的Latent Dirichlet分配(LDA)生成客户评论的yelp数据集。在生成令牌时,我只选择有...的单词

回答 2 投票 0

LDA主题模型性能 - 用于scikit-learn的主题一致性实现

我有一个关于测量/计算scikit-learn中构建的LDA模型的主题一致性的问题。主题一致性是衡量给定LDA主题的人类可解释性的有用指标......

回答 2 投票 4

如何比较Python Gensim中两个文档与主题分布的主题相似性?

我使用Gensim在语料库上训练了LDA模型。既然我已经为每个文档分配了主题,那么如何比较主题中两个文档的相似程度呢?我想要一个总结......

回答 1 投票 1

Gensim LDA:相干值在运行之间不可重现

我使用此代码https://datascienceplus.com/evaluation-of-topic-modeling-topic-coherence/来查找数据集的主题一致性。当我尝试使用相同数量的主题的代码时,我得到了新的......

回答 1 投票 0

如何使用Gensim应用句子级LDA模型?

是否可以按照Bao和Datta(2014)的建议使用Gensim应用句子级LDA模型?论文在这里。其独特之处在于它使“每句话假设一个主题”......

回答 1 投票 0

为什么我们需要LDA中的超参数beta和alpha?

我试图理解潜在Dirichlet分配(LDA)的技术部分,但我有几个问题在我的脑海中:第一:为什么我们每次采样方程时都需要添加alpha和gamma ...

回答 1 投票 0

LDA vs Word2Vec。哪个是预测邮件收件人的正确解决方案?

我正在研究各种NLP算法和工具来解决以下问题; NLP新手在这里,所以请原谅我的问题,如果它太基本了。让我们说,我有一个消息应用程序,用户可以发送...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.