topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

使用词嵌入进行主题建模

我目前正在尝试创建一个带有词嵌入的 LDA 模型。这是代码: 从 gensim.models.ldamodel 导入 LdaModel 从 gensim.corpor.dictionary 导入字典 来自 gensim.test.ut...

回答 1 投票 0

使用 Python 中的文本响应过滤用户访谈

我正在分析大量用户访谈数据集,并且正在使用主题建模和情感分析。为了使它更有用,我按文本响应进行过滤,例如查看

回答 0 投票 0

你能否对两个文档-主题矩阵取平均值,例如一个由 LDA 生成,另一个由 NMF 生成?

我想使用两个模型进行主题建模。有没有可能我得到两个不同的文档主题矩阵的平均值以获得一个新的文档主题矩阵?如果没有,有没有办法使用...

回答 0 投票 0

任何人都可以让 lda2vec 在 2023 年现在工作吗?

我目前正在尝试对一些推文进行主题建模。所以,我偶然发现了我一直在尝试实现的 lda2vec 模型——但我在这个过程中并没有走得太远,因为我遇到了诸如 ...

回答 0 投票 0

何时使用 NLP,如何使用分类数据规范化数据框列?

我有一个 df: 劳芬登, Zielgruppe, 行为调查 在 Zielgruppe 列中,我有每个 laufendeNr 的分类数据,例如: 舒勒, 莱勒, 全民投票 在一排。 我想...

回答 0 投票 0

使用 pandas 进行主题分析

所以我正在使用 gensim for LDA 对 csv 文件进行主题建模;我面临的问题是在熊猫中,这是代码 - d_s['text_clean'] = d_s['text'].apply(clean) 这是错误 PS C:\用户\

回答 0 投票 0

在 R 中查找单词共现

我在 R 中运行了主题建模。这已经返回给我一些主题以及我的数据框中某个词属于该主题的概率。例如,主题 7 是“宗教/基督教……

回答 1 投票 0

在一个表中显示多个主题的结构主题模型(STM)estimateEffect()的输出

我想在一个表中显示多个主题的 STM estimateEffect() 的输出。作为参考,最佳情况下我希望输出看起来像几个回归模型被显示时的样子......

回答 0 投票 0

sequence item 0: expected str instance, tuple found(2)

我分析了先例中的数据,尝试使用主题建模。这里有一个 我正在使用的语法: 根据报错,我认为应该是字符串应该在什么时候进去 加入,但是元组 ...

回答 0 投票 0

有没有一个R包来进行主题一致性和评估主题模型?

在下面的链接中。Topic Coherence To Evaluate Topic Models 描述了主题一致性方法来解决主题模型的评估。你知道有哪些R包能够执行这个任务吗?...

回答 1 投票 0

无法导入gensim模块

我使用(pip install gensim)安装了gensim模块,安装成功 成功安装 boto-2.49.0 boto3-1.12.45 botocore-1.15.45 docutils-0.15.2 gensim-3.8.2 jmespath-0.9.5 ....

回答 1 投票 0

如何解决LDA模型一致性得分运行时出错?

text='Alice是一个学生,她喜欢学习,老师给了很多作业。我试图从一个简单的文本(如上图)中获取具有连贯性得分的主题,这是我的LDA模型:id2word=......。

回答 1 投票 0

利用LDA进行主题建模前的维度降低

我想用LDA做一些话题建模,但遗憾的是我的数据很稀疏,结果并不令人满意。因为我还是想尝试用LDA来解决我的任务(即使有 ...

回答 1 投票 0

如何根据预定义的语言类别来衡量一个文档的差异性?

我有3类词,分别对应不同类型的心理驱动力(权力需求、成就需求和亲和需求)。目前,在我的样本中,每一份文档(n=...

回答 1 投票 0

将多个多行的txt文件合并为一个csv文件(1行=1个文件),用于主题建模。

我目前有30个文本文件,都有多行。我想根据这个教程应用一个LDA模型。所以,对我来说,它应该是这样的:text of document1 text of document2 text of document3......。

回答 1 投票 0

替换R中测量单位的具体缩写。

我有一个数据集(一个文本语料库),我正在进行主题建模。在数据集中,计量单位或货币的拼写或缩写不同。例如,250米代表250 ...

回答 1 投票 1

来自R中给定csv文档术语矩阵的lda主题建模交叉验证

我正在尝试进行交叉验证分析,以选择要估计的“适当”主题数。但是,我的数据已被编码在三列(相当大)的表中。这是一个示例:...

回答 1 投票 0

如何清除包含“句点”的缩写(例如“。”,“ st。”,“ rd。”),但保留“。”在句子结尾吗?

我正在研究R中的句子级LDA,目前正在尝试使用来自openNLP包中的send_detect()函数将文本数据拆分为单个句子。但是,我的文本数据...

回答 1 投票 1

删除R中的标点符号,但保留标点符号/“句子标记”“!”,“。”,“?”在句子末尾

我目前正在尝试在我正在使用的文本语料库上创建基于句子的LDA。为了检测句子并将它们拆分,我正在使用openNLP包中的sent_detect()函数。 ...

回答 1 投票 0

如何避免对textplot :: plot.BTM()进行群集可视化处理,因为它们具有非常厚的边缘和低对比度的阴影?

[目标和工具,我目前尝试熟悉R包BTM和文本图,这就是如何创建用BTM创建的双向术语模型(BTM模型)的可读性和有意义的可视化...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.