topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

是否有一种方法可以通过矩阵乘法从gensim LDA预训练模型中推断看不见的文档上的主题分布?

是否有一种方法可以使用预训练的LDA模型而不使用LDA_Model [unseenDoc]语法来获取未见文档的主题分布?我正在尝试将我的LDA模型实现为网络...

回答 1 投票 0

用R中的一个唯一单词替换单词列表

我正在使用R进行文本分析,并且拥有一个数据集(文本语料库),该数据集包含有关不同水果的各种句子。例如:“苹果”,“香蕉”,“橙色”,“梨”等。因为它不是...

回答 1 投票 0

关于短文本Python的主题建模

我想对短文本进行主题建模。我对LDA进行了一些研究,发现它与短文本结合得不好。哪种方法会更好,并且它们具有Python实现?

回答 1 投票 0

将段落分为具有有意义的子段落

[通常,一个段落包含许多子段落,每个子段落都具有一定的含义。在NLP中,如何将段落拆分为具有含义的子段落,或者换句话说,我...

回答 1 投票 0

python中GSDMM的实际示例?

我想使用GSDMM将主题分配给数据集中的某些推文。我发现的唯一示例(1和2)不够详细。我想知道您是否知道一个来源(或足够小心以制作一个小...

回答 1 投票 1

相干分数(u_mass)-18是好是坏?

我读了这个问题(相干分数0.4是好还是不好?),发现相干分数(u_mass)从-14到14。但是当我做实验时,我的u_mass得分为-18,而0.67对于...

回答 1 投票 0

从LDA模型对主题建模进行重新训练或重新分组的结果

我想知道是否有可能通过LDA模型中的输出主题重用单词,然后通过使用LDA模型或单词向量再次将它们重新分组为新的组?有人知道吗,我们...

回答 1 投票 0

Sk-Learn GridSearchCV适合全部数据

我使用sklearn GridSearchCV使用lda模型搜索#个主题。拟合模型后,拟合的模型将保存在CV_model.best_estimator_中。基于skelarn文档,GridSearchCV具有默认值...

回答 1 投票 0

给出具有多个主题的文本,如何提取特定主题的详细信息

我正在研究毒品评论的情绪分析。每个评论的文字都可以包含一个或多个药物提及。文本包含针对同一疾病的多种相关药物的观点。因此,相同的...

回答 1 投票 0

根据Gensim模型计算余弦相似度

我正在尝试通过Gensim LDA主题模型计算主题间的余弦相似度得分,但这比我最初预期的要复杂。 Gensim有一种计算距离的方法...

回答 1 投票 0

为什么Sklearn LDA主题模型总是建议(选择)主题最少的主题模型?

我正在对文本数据进行主题建模(大约4000条新闻文章)。为此,我正在使用Sklearn LDA模型。在执行此操作时,我使用GridSearchCV选择最佳模型。但是,几乎所有...

回答 1 投票 0

如何为R主题模型正确编码UTF-8 txt文件

类似的问题已经在该论坛上进行了讨论(例如,这里和这里),但是我没有找到能够解决我的问题的问题,因此,我为一个看似相似的问题表示歉意。我有一组.txt文件...

回答 1 投票 0

从预先训练的模型中获取句子的主题

我有一个文本文件中的10个句子列表。我想使用现有的主题模型来获取每个句子的主题。在我发现的所有教程中-他们在语料库上训练了主题模型....

回答 1 投票 0

使用Gensim实现潜在的Dirichlet分配

我正在做有关LDA主题建模的项目,我使用gensim(python)来做到这一点。我阅读了一些参考资料,它说要获得最佳的模型主题,thera是我们需要确定的两个参数,...

回答 1 投票 0

是否可以从R中的字符串中删除所有副词和代词?

我是R的新手。在尝试执行主题建模时,我需要从数据集中删除所有不相关的单词。是否有一个功能可以找到属于语音特定部分的单词?

回答 1 投票 0

如何将详细文本映射到一个字母组合或二元组

我正在尝试找出要求的解决方案,其中要求将长文本映射为unigram或bigrams。例如,“具有激励和管理团队的能力。您应该能够跟踪...

回答 1 投票 0

如何在LDA模型中获取新文档的主题

如何在LDA模型中动态传递用户提供的.txt文档?我已经尝试了下面的代码,但是无法提供适当的文档主题。我的.txt主题与“体育”相关,所以它是...

回答 2 投票 0

一些整理文本的帮助

我有一个正在使用tidytext处理的项目,这是我的新手。我的输入数据当前为文件夹中单个.txt文件的形式。我成功地使用get_sentiments()来跟踪...

回答 1 投票 1

主题建模-在sklearn中运行LDA:如何计算Wordcloud?

我在sklearn中训练了我的LDA模型以构建主题模型,但是不知道如何为每个获得的主题计算关键字Wordcloud?这是我的LDA模型:vectorizer = ...

回答 1 投票 0

基于特征的主题分布的Mallet DMR负适用性?

我已经创建了DMR主题模型(通过Java API),该模型根据文档的发布年份来计算主题分布。由于存在...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.