lda 相关问题

Latent Dirichlet Allocation,LDA,是一种生成模型,它允许未观察到的组解释观察集,解释为什么数据的某些部分是相似的。

如何实现与sklearn LDA多核处理?

我一直在使用sklearn LDA一个主题模式。我的阴茎有〜75K的文件和矩阵形状从语料库产生是X.shape =(74645,91542)。当我通过这个矩阵sklearn LDA它需要我的3个小时...

回答 1 投票 1

如何从gensim打印LDA主题模型?蟒蛇

使用gensim我能够从LSA中的一组文档中提取主题但是如何访问从LDA模型生成的主题?打印lda.print_topics(10)时,代码给出了......

回答 9 投票 15

更快的LDA实施

我正在实现LDA,并避免使用现成的库。我试过python / numpy。拥有100万条记录,词汇量约为2000,仅需1分钟即可完成约7分钟的...

回答 1 投票 0

在执行困惑函数时获取错误以评估LDA模型

我正在尝试评估主题建模(LDA)。在解决困惑时获取错误函数为:(函数(classes,fdef,mtable)中的错误:无法找到函数的继承方法...

回答 1 投票 2

概率线性判别分析

python是否有任何库可以用于fisher的线性判别分析或概率线性判别分析?在死路一条

回答 1 投票 -2

如何在lda中改进不同主题的单词分配

我正在研究一种不是英语的语言,而且我从不同的来源中删除了数据。我已经完成了我的预处理,如标点符号删除,停用词删除和标记化。现在我 ...

回答 1 投票 3

Sagemaker LDA主题模型 - 如何访问训练模型的参数?还有一种捕捉连贯性的简单方法

我是Sagemaker的新手,我正在运行一些测试来测量AWS上NTM和LDA的性能,与LDA槌和原生Gensim LDA模型相比。我想要检查训练有素的模型......

回答 1 投票 0

标记的LDA +指导LDA主题建模

我对机器学习,NLP和LDA都很陌生,所以我不确定我是否完全正确地接近我的问题;但我试图用已知主题进行无监督的主题建模......

回答 1 投票 1

Spark(2.3.1)LDA转换内存错误(java.io.ByteArrayOutputStream.hugeCapacity上的java.lang.OutOfMemoryError(ByteArrayOutputStream.java:123)

我使用Spark 2.3.2训练了LDA(特征维度:100,迭代:100,分布式版本,ml)。之后我想使用该模型转换新的DataSet。但是当我转换新数据时,我......

回答 1 投票 0

使用LDA(主题模型):每个主题在单词上的分布是相似的并且“平坦”

Latent Dirichlet Allocation(LDA)是一个主题模型,用于查找一堆文档的潜在变量(主题)。我正在使用python gensim包并且有两个问题:我打印出最多......

回答 1 投票 6

潜在Dirichlet分配的时间复杂度

在文档数量(D),主题(T),文档平均长度(L)和单词(W)方面,Latent Dirichlet Allocation的计算复杂度是多少?

回答 1 投票 -3

如何将Sklearn lda模型输出保存到csv?

如何将Sklearn LDA模型输出保存到csv?它没有show_topics命令作为genism lDA模型。 def selected_topics(model,vectorizer,top_n = 10):对于idx,枚举中的主题(模型....

回答 3 投票 0

Spark LDA消耗太多内存

我正在尝试使用spark mllib lda来总结我的文档语料库。我的问题设置如下。大约100,000个文档大约400,000个独特单词100个集群我有16个服务器(每个有20个...

回答 1 投票 12

为什么LDA预测不正确

步骤1我正在使用R和“topicmodels”包从4.5k文档语料库中构建LDA模型。我做了通常的预处理步骤(停用词,削减低/高字频率,词形还原)和......

回答 1 投票 2

将Word嵌入与来自LDA的主题词分发相结合,用于文本摘要

我是NLP的新手,我想知道通过考虑Word嵌入来总结已经通过LDA等方法分类到某个主题的文档是否是一个好主意...

回答 1 投票 -1

来自`gensim`的LDA(Latent Dirichlet Allocation)推断如何用于新数据?

我正在使用gensim训练我的ldamodel,并预测使用像这个ldamodel [doc_term_matrix_test]的测试语料库,它工作得很好,但我不明白预测是如何使用...

回答 1 投票 1

AttributeError:'Series'对象没有属性'sort_values'

pyLDAvis库准备方法在使用pandas库时崩溃了。这是代码:def load_R_model(filename):open(filename,'r')为j:data_input = json ....

回答 2 投票 4

进行AD / LDAP查询而不将用户名/密码存储为明文

嗨,我正在创建Cloudera环境,并希望与其他团队分享。该脚本应该查询我们的Active Directory服务器。但不幸的是我不想把我的密码/用户名...

回答 1 投票 3

Gensim LDA alpha参数

我在gensim的lda实现中尝试了alpha的三个默认选项,现在想知道结果:所有文档的主题概率总和小于...中的文档数量。

回答 2 投票 0

没有名为'sklearn.lda'的模块

当我在openface demos目录中运行classifier.py时使用:classifier.py train ./generated-embeddings/我收到以下错误信息: - >来自sklearn.lda import LDA ...

回答 2 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.