在Python中对主题进行聚类并命名集群

问题描述 投票:0回答:1

我的数据中有数百万个主题。这些主题为 1 到 12 个单词。例如,“癌症生物学和遗传学”可能是一个主题,“再生医学”可能是另一个主题。我想创建相似主题的集群并命名它们。我尝试了 BERT+K-Means 对这些主题进行聚类,效果很好。我对 NLP 不太了解,想用最好的方法来实现这一点。我也没有办法以有意义并代表集群的方式来命名这些集群。请指教

python nlp cluster-analysis topic-modeling
1个回答
0
投票

我不知道命名集群的标准自动化方法 - 进行主题建模和无监督学习的部分工作通常是进行事后分析并确定主题/集群是否有意义以及它们“是关于什么” 。然而,研究中肯定有一些方法,例如使用神经嵌入自动标记主题

根据您想要做什么,您也许可以作弊并将单词列表提供给生成式 AI 模型(i.e. 只需询问 ChatGPT)以获得快速开始/获得一些初步结果的建议。

© www.soinside.com 2019 - 2024. All rights reserved.