如何在gensim中获得过滤后的二元组的分数?

问题描述 投票:0回答:2

给定文档单词列表,例如

[['cow','boy','hat','mat],['village','boy','water','cow']....]
,gensim可以用来获取bi-gram,如下:

bigrams = gensim.models.Phrases(data_words, min_count=1,threshold=1) 
bigram_model = gensim.models.phrases.Phraser(bigrams)

我想知道如何获得在bigram_model中检测到的每个bi-gram的分数?

python gensim lda
2个回答
1
投票

事实证明,就像使用一样简单:

bigram_model.phrasegrams

产生如下所示的结果:

{(b'cow', b'boy'): 23.3228613654742079,
 (b'village', b'water'): 1.3228613654742079}

0
投票

分数=

  1. RJA

sentence_bleu(参考,候选,权重=(0.25,0.25,0.25,0.25)) 打印(分数)

© www.soinside.com 2019 - 2024. All rights reserved.