我正在尝试评估自制主题模型。为此,我正在使用主题列表(用关键字表示),并想要使用gensim.models.coherencemodel.CoherenceModel,并在语料库上调用它,该语料库是字符串列表(每个字符串都是一个文档)。CoherenceModel需要一个Dictionary,但我不知道它对应什么以及如何获得它。我正在使用TfidfVectorizer中的sklearn对文本进行矢量化,并使用glove中的gensim嵌入来计算模型中的相似度。
gensim.models.coherencemodel.CoherenceModel
CoherenceModel
Dictionary
TfidfVectorizer
sklearn
glove
gensim