我能够创建lda模型并保存它。现在我正在尝试加载模型,并传递一个新文档
lda = LdaModel.load('..\\models\\lda_v0.1.model')
doc_lda = lda[new_doc_term_matrix]
print(doc_lda )
在打印doc_lda时,我得到了对象。 <gensim.interfaces.TransformedCorpus object at 0x000000F82E4BB630>
但是我想得到与之相关的主题词。我必须使用什么方法。我指的是this。
不确定这是否仍然相关,但你尝试过get_document_topics()
吗?虽然我认为只有在使用update()
更新LDA模型后才能使用。
我认为您的代码没有任何问题 - 您发布的文档链接中的“用法示例”使用doc2bow
返回稀疏向量 - 我不知道new_doc_term_matrix
包含什么,但我认为它工作正常。
你可能想看看this stackoverflow question:你想要print
一个“对象” - 这是不可打印的,你想要的数据是在对象中的某个地方,而且它本身是可打印的。
或者,您也可以使用IDE的功能 - 例如Spyder中的Variable explorer - 单击您自己的对象并获取所需的信息。
有关使用gensim进行相似性分析的更多信息,请参阅this tutorial。