topic-modeling 相关问题

主题模型描述了文档和文本中主题的频率。 “主题”是一组倾向于一起出现的单词。

运行LDA时后验函数出错

我正在尝试对数据集进行主题建模。我遵循标准程序,清理数据,标记化,创建 dtm 并应用 LDA 函数(主题 <- tidy(my_topic_model, matrix = "...

回答 1 投票 0

如何在双项主题建模中将主题分配给单个文档/推文?

我是这方面的新手,所以如果我在这里问显而易见的问题,我深表歉意。我运行了双项主题建模算法来对短文本数据进行建模并发现其中的主题。我正在使用 LDAvis 包

回答 1 投票 0

引用的主题建模

基于以下链接:引号 在以下代码的帮助下(该网站基于javascript,所以首先我已禁用它) 进口硒 从硒导入网络驱动程序 来自 selenium.webdr...

回答 1 投票 0

导入错误:无法从部分初始化的模块“gensim.parsing.preprocessing”导入名称“remove_stopwords”

我有Python 3.12.2和gensim 4.3.2,但是当我尝试在Python代码中使用Import gensim时,出现以下错误: ImportError Traceback(最近一次调用最后一次) 细胞...

回答 1 投票 0

在 Google Colab 中安装“TopicModels”包时出错

由于我需要更多的计算资源,我开始在 Google Colab 上运行我的 R 代码。我可以安装我需要的大部分软件包,但对于“TopicModels”软件包...

回答 1 投票 0

Gensim HDP - 文档的热门主题分布

我想要我的文档的主题分布。然而,Gensim 的 HDP 的 show_topic() 默认返回 20 个主题。我想他们不应该是最好的。深入挖掘后,我发现......

回答 1 投票 0

导入bertopic的同时导入UMAP出现问题

所以我的代码一切正常,然后突然 hdbscan 不再工作了,然后我重新安装了所有软件包,现在我遇到了 umap 问题。 我做了这里和

回答 2 投票 0

BERTopic:“确保可迭代对象仅包含字符串”

我对Python还很陌生,所以这可能比我看起来更容易,但我被困住了。我正在尝试使用 BERTopic 并使用 PyLDAVis 可视化结果。我想将结果与

回答 1 投票 0

使用 flan-t5-small 通过 LLM(私人)和 LangChain 或 LlamaIndex 进行摘要和主题提取

有人使用 Langchain 或 LlamaIndex 导入来处理数量超过 512 个代币的单个文档吗?是的,我知道还有其他方法可以处理它,但很难找到

回答 1 投票 0

BER主题:为术语分数下降添加图例

我绘制了我在 Google Colab 上使用 BERTopic 创建的主题模型的术语分数下降情况。功能很棒。工作整洁!但我需要添加一个图例。 topic_model 中未指定此参数。

回答 1 投票 0

如何解决这个“IndentationError:需要缩进块”? [重复]

def remove_stopwords(文本,nlp,custom_stop_words =无,remove_small_tokens = True,min_len = 2): 如果自定义停止词: nlp.Defaults.stop_words |= custom_stop_words 过滤语句=[] ...

回答 2 投票 0

如何在bertopic建模中获取每个主题的所有文档

我有一个数据集,并尝试使用 berTopic 建模将其转换为主题,但问题是,我无法获取主题的所有文档。 berTopic 每个主题仅返回 3 个文档。 主题模型 =

回答 2 投票 0

R:Quanteda+LDA,如何可视化结果?

请查看本文末尾的片段。 我使用 Quanteda 运行了主题建模的简化教程示例,但是一旦模型完成运行,我发现很难额外...

回答 1 投票 0

提到主题建模和自然语言处理中的“短文本”,短文本的长度定义是什么?

说到主题建模和自然语言处理中的“短文本”,短文本的定义到底是什么?我一直无法找到明确的答案。可以...

回答 1 投票 0

长文本主题建模差异

我有一些很长的文档。他们的总体主题相当标准,但每个文档都会以不同的方式强调主题,并且在这些主题中它们将有不同的子主题......

回答 1 投票 0

R topicmodels包:做LDA时如何设置Beta(eta)的参数?

使用R包topicmodels和函数LDA(),如何设置Beta(或eta)? 我知道我们可以通过在LDA命令中写入control=list(alpha = 0.5)来设置Alpha参数,但是eta=不行

回答 1 投票 0

如何在 R 中使用 LDAvis 可视化种子 lda 模型?

我正在使用 R seededlda 包来训练种子 lda 模型。 textmodel_seedlda(dfmt, dict, 残差 = TRUE) https://github.com/koheiw/seededlda 我想知道是否有一种方法可以可视化 m...

回答 1 投票 0

主题建模:当使用 Quanteda dfm 对象制作主题模型时,如何“寻找想法”STM 功能?

我是主题建模的新手,所以我会尽力描述我的问题。基本上,我想直观地检查构成我的主题模型中的主题的文档。我用的是以下...

回答 1 投票 0

根据分类指标评估 BERTopic 模型

我无法找到检查使用 BERTopic 创建的主题模型的一致性分数时遇到的问题的解决方案。我对使用这些方法进行 NLP 很陌生,尤其是对使用 Pyt 很陌生......

回答 2 投票 0

如何指定列名?

我正在编写主题建模的代码。我收到这个错误。 安装.packages(“tm”) install.packages(“主题模型”) 图书馆(TM) 库(主题模型) 文档 <- Corpus(Vector...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.