相干分数(u_mass)-18是好是坏?

问题描述 投票:0回答:1

我读了这个问题(Coherence score 0.4 is good or bad?),发现相干得分(u_mass)从-14到14。但是当我进行实验时,我对u_mass的得分为-18,对c_v的得分为0.67。我想知道我的u_mass得分如何超出范围(-14、14)?

nlp lda topic-modeling lsa topicmodels
1个回答
0
投票

根据original paper中提供的u_mass相干得分的数学公式。

如果u_mass接近值0表示完美的连贯性,并且它在值0的任一侧波动,则取决于所选主题的数量以及用于执行主题聚类的数据类型。判断u_mass的最佳方法是绘制u_mass与K的不同值(主题数)之间的曲线。选择K,其u_mass的值接近0。

您可以参考此link,它提供了python代码片段来绘制K和c_v的不同值之间的曲线。在这里,您可以将c_v替换为u_mass相关性指标。

我希望这个解释有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.