topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

如何将令牌与字典键匹配并获得相应的值

我有一个带有令牌的数据框,如下所示,我想与字典的键匹配并获取相应的键和值。数据帧:A B 1 ['i','like','apples ......

回答 1 投票 0

如何从现有文本集群中提取主题?

我已经对文本语料库进行了硬聚类(使用tf-idf权重,并获得了〜= 200个聚类。如果我想获得每个群集的主题,该怎么做?我已经尝试在...

回答 1 投票 0

Python WindowsError:[错误123]文件名,目录名称或卷标签语法不正确

我从DARIAH项目网站获得以下代码,以Python进行主题建模。当我在命令外壳中运行脚本时,它开始读取文件,但始终停留在以下位置:**读取文件... ...

回答 1 投票 0

对工作描述句子进行分类的方法

我需要对n = 630个职位描述的job_experience部分中的各个句子进行分类/分类。我对提取工作经验和与能力相关的句子特别感兴趣,...

回答 1 投票 0

Amazon Sagemaker中用于主题建模的LDA和NTM有什么区别?

我正在寻找LDA和NTM之间的区别。在NTM上使用LDA有哪些用例?根据AWS文档:LDA:Amazon SageMaker潜在Dirichlet分配(LDA)算法是...

回答 1 投票 1

按数据类别的主题建模

我想看看是否有一种方法可以通过使用LDA按类别而不是整个数据集进行主题建模来获取主题。我的数据看起来像这样。评论...

回答 1 投票 0

计算一致性得分时出错– AttributeError:'dict'对象没有属性'id2token'

我是NLP的初学者,这是我第一次进行主题建模。我能够生成模型,但是无法生成一致性度量。将术语文档矩阵转换为新的...

回答 1 投票 0

Gensim LdaMulticore不能正确地进行多处理(仅使用4个工人)

我正在使用Gensim的LDAMulticore执行LDA。我有大约2千8百万个小文档(每个约100个字符)。我给工人的参数是20,但最上面仅用4个过程显示了它。 ...

回答 1 投票 3

主题调制:如何在C中使用LDA作为示例数据?

我想尝试Blie .et.al的LDA -c代码。就像在此链接中一样。我已经编译了代码,并且在终端中运行./lda时,将显示以下结果。用法:lda est [初始字母] ...

回答 2 投票 1

在邻接数据帧中转换事件列表数据帧

我有一个df,其中每列代表一个事件,并且在单元格中有个体,例如:df = data.frame(topic1 = c(“ a”,“ b”,“ c”,“ d”) ,topic2 = c(“ e”,“ f”,“ g”,“ a”),topic3 = c(“ b”,“ c”,“ g”,“ ...

回答 1 投票 -1

当重采样方法不适用于文本时,如何为文本分类创建SMOTE管道步骤?

我有一个带有大类不平衡问题的多标签分类问题,因此我想使用SMOTE创建流水线步骤,但由于X基本上是文本,而Y是1和...的数组,所以] >

回答 1 投票 1

解析鸣叫的列表,以便利用Gensim Word2Vec

我工作的一个NLP的问题,我的目标是能够通过Python的Gensim库已经使用Word2Vec后通过我的数据转换成sklearn的交易算法。潜在的问题我试图解决的是...

回答 1 投票 0

为什么random_state参数在NMF和LDA算法中使用?什么是使用每次生成随机话题的好处是什么?

对于主题建模,为什么random_state参数NMF和LDA算法用于?什么是使用每次生成随机话题的好处是什么?

回答 1 投票 1

如何从gensim打印LDA主题模型?蟒蛇

使用gensim我能够从LSA中的一组文档中提取主题但是如何访问从LDA模型生成的主题?打印lda.print_topics(10)时,代码给出了......

回答 9 投票 15

在执行困惑函数时获取错误以评估LDA模型

我正在尝试评估主题建模(LDA)。在解决困惑时获取错误函数为:(函数(classes,fdef,mtable)中的错误:无法找到函数的继承方法...

回答 1 投票 2

将数据框中的变量转换为术语文档矩阵

我有一个数据框,其中包含我想要执行Latent Dirichlet分配的段落。为此,我需要创建一个术语文档矩阵。此示例代码显示错误:library(...

回答 2 投票 0

Gensim LDA提供主题ID但概率的输出不等于1

我已经将LDA模型训练到了100个集群主题,根据我的知识,每个主题都应该以一定的概率输出,所有这些都加起来1.但是当我运行这个代码时,我得到......

回答 1 投票 0

如何在lda中改进不同主题的单词分配

我正在研究一种不是英语的语言,而且我从不同的来源中删除了数据。我已经完成了我的预处理,如标点符号删除,停用词删除和标记化。现在我 ...

回答 1 投票 3

标记的LDA +指导LDA主题建模

我对机器学习,NLP和LDA都很陌生,所以我不确定我是否完全正确地接近我的问题;但我试图用已知主题进行无监督的主题建模......

回答 1 投票 1

LDA主题模型按年绘制

我试图在这个文件中按年绘制推文主题https://www.mediafire.com/file/64lzbt46v01jbe1/cleaned.xlsx/file可以很好地获取主题,但是当我尝试按年绘制它们时我有一个 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.