使用python绘制文本聚类中的单词

问题描述 投票:0回答:2

对于我的聚类,我得到了如下图所示的结果。

enter image description here

是否有任何类似于fvid_clusters的库可以生成如下所示的图? (使用PYTHON)

enter image description here

python cluster-analysis unsupervised-learning
2个回答
1
投票

Plots并不像你展示的那样,但是我喜欢使用两个工具来探索文本聚类的结果(两者都有Python的绑定)。

白蚁:http://vis.stanford.edu/papers/termite

Termite

UMAP:https://umap-learn.readthedocs.io/en/latest/

这是使用BBC Sports dataset用NMF(来自我的论文)进行主题建模的结果。

BBC Sports


0
投票
  • 第1步:将单词矢量化为向量(每个大小为n)
  • 第2步:使用kmean将它们聚类为k个簇
  • 步骤3:对步骤1中生成的向量运行PCA并将其减少为2维(比如x,y)
  • 步骤4:在位置(x,y)处绘制单词,其中(x,y)是PCA从其大小为n的全尺寸向量减小的维度。将与其在步骤2中识别的群集对应的单词着色(每个群集使用一种颜色)。
© www.soinside.com 2019 - 2024. All rights reserved.