我可以通过同时推断所有文档来保存我想要推断的每个文档的doc2vec模式的随机状态吗?

问题描述 投票:0回答:1

有没有办法同时推断多个文档,以使用Gensim Doc2Vec保留模型的随机状态?

函数infer_vector定义为

infer_vector(doc_words, alpha=None, min_alpha=None, epochs=None, steps=None)¶

其中doc_words(str列表) - 将推断出矢量表示的文档。而且我找不到任何opther选项来同时推断多个文档。

gensim word2vec doc2vec
1个回答
1
投票

目前没有可以同时推断多个文档的选项。这是infer_vector()(在open issue中收集)的许多愿望清单改进之一,但是没有正在进行的工作或有针对性的发布。

我不确定你的意思是“保留模型的随机状态”。我可以看到批处理的主要动机是用户方便,或通过多线程增加性能。

如果您真正想要的是确定性推理,请参阅answer in the Gensim FAQ which explains why deterministic Doc2Vec inference isn't necessarily a good idea。 (它还包括一个关于如何强迫它的一些问题的链接,如果你决定这样做,尽管有充分的理由不这样做。)

© www.soinside.com 2019 - 2024. All rights reserved.