lda 相关问题

Latent Dirichlet Allocation,LDA,是一种生成模型,它允许未观察到的组解释观察集,解释为什么数据的某些部分是相似的。

STM() 矩阵中的错误::矩阵(x):无效的“数据”

我正在尝试使用 R 中的 stm() 运行结构主题模型。 当我输入以下代码时: stm.输出<- stm(dtm2,K=0,prevalence=covs2,verbose=F,data = brady_sub2) Following error pops up:

回答 0 投票 0

WordCloud 仅支持 TrueType 字体

我正在尝试使用 Python 中的 WordCloud 模块生成词云,但是每当我调用 .generate 时都会看到以下错误 追溯(最近一次通话): 文件“/mnt/6db3226b-...

回答 1 投票 0

使用 ldaseqmodel 提取的主题自动标记数据

我正在使用 ldaseqmodel 进行动态主题建模。我想标记我用 ldaseqmodel 提取的哪些主题。所以我使用了 ldaseq.doc_topics(doc_number) 方法来编写...

回答 0 投票 0

如何理解gensim LDA模型中的“Phi值”

在文档中, 我想知道 gensim LdaModel 中每个文档的主题术语概率。 我得到了这样的东西 lda_model = LdaModel(语料库, id2word=字典,

回答 1 投票 0

pyLDAvis 错误 AttributeError: 'CountVectorizer' object has no attribute 'get_feature_names'

我正在为我的一个项目进行主题建模,并努力将结果可视化。我认为程序是正确的。特别是当我运行这条线时 vis = pyLDAvis.sklearn.prepare(b...

回答 2 投票 0

使用词嵌入进行主题建模

我目前正在尝试创建一个带有词嵌入的 LDA 模型。这是代码: 从 gensim.models.ldamodel 导入 LdaModel 从 gensim.corpor.dictionary 导入字典 来自 gensim.test.ut...

回答 1 投票 0

你能否对两个文档-主题矩阵取平均值,例如一个由 LDA 生成,另一个由 NMF 生成?

我想使用两个模型进行主题建模。有没有可能我得到两个不同的文档主题矩阵的平均值以获得一个新的文档主题矩阵?如果没有,有没有办法使用...

回答 0 投票 0

任何人都可以让 lda2vec 在 2023 年现在工作吗?

我目前正在尝试对一些推文进行主题建模。所以,我偶然发现了我一直在尝试实现的 lda2vec 模型——但我在这个过程中并没有走得太远,因为我遇到了诸如 ...

回答 0 投票 0

CNN 模型没有达到很好的准确性

我的代码面临准确性问题。我在 MPhil 研究中使用 CNN 作为模型,使用 LDA 使用 NSL-KDD 数据集进行特征缩减,但准确率为 94% 我不知道怎么回事,我想要...

回答 0 投票 0

我应该如何在Spark LDA中获取每个文档的主题?

我的目标是我有一些新闻语料库,我想用LDA来提取每个新闻文档的关键词,关键词也可以称为标签,表示这个新闻是关于什么的。而不是...

回答 1 投票 0

ggplot用R对LDA中的β值进行排序。

我在LDA分析过程中画了一张图,但我想根据β值按降序得到图。 ap_topics

回答 1 投票 1

如何解决LDA模型一致性得分运行时出错?

text='Alice是一个学生,她喜欢学习,老师给了很多作业。我试图从一个简单的文本(如上图)中获取具有连贯性得分的主题,这是我的LDA模型:id2word=......。

回答 1 投票 0

利用LDA进行主题建模前的维度降低

我想用LDA做一些话题建模,但遗憾的是我的数据很稀疏,结果并不令人满意。因为我还是想尝试用LDA来解决我的任务(即使有 ...

回答 1 投票 0

如何计算sklearn LDA模型的一致性得分?

这里,best_model_lda是一个基于sklearn的LDA模型,我们试图找到这个模型的一致性得分... coherence_model_lda = CoherenceModel(model = best_lda_model,texts=data_vectorized,...)

回答 1 投票 1

将多个多行的txt文件合并为一个csv文件(1行=1个文件),用于主题建模。

我目前有30个文本文件,都有多行。我想根据这个教程应用一个LDA模型。所以,对我来说,它应该是这样的:text of document1 text of document2 text of document3......。

回答 1 投票 0

按主题分类文本的日期标记化

我需要将以下列按日期标记为 Testo Giorno LE DESIGNAZIONI ARBITRALI DELLE SEMIFINALI DI RITORNO. 06022020 ...

回答 1 投票 1

['int'在运行pyldavis时在python中不是可迭代的错误

我正在ipython中运行我的代码(正在运行python版本2.7)。调用“ pyLDAvis”功能以可视化LDA生成的主题时发现错误。以下错误:topic_df = pd.DataFrame([dict((y,x)...

回答 1 投票 1

来自R中给定csv文档术语矩阵的lda主题建模交叉验证

我正在尝试进行交叉验证分析,以选择要估计的“适当”主题数。但是,我的数据已被编码在三列(相当大)的表中。这是一个示例:...

回答 1 投票 0

使用LDA进行主题提取的标记化

我正在尝试从某些文本中提取主题。我有一列名为“文本”的文字,例如34 fino a 2 giorni。 èquesto il tempo massimo di ... 36 il morbilloècontagioso anche fuori ... 44 altra ...

回答 1 投票 0

删除R中的标点符号,但保留标点符号/“句子标记”“!”,“。”,“?”在句子末尾

我目前正在尝试在我正在使用的文本语料库上创建基于句子的LDA。为了检测句子并将它们拆分,我正在使用openNLP包中的sent_detect()函数。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.