有没有办法同时推断多个文档,以使用Gensim Doc2Vec保留模型的随机状态?
函数infer_vector定义为
infer_vector(doc_words, alpha=None, min_alpha=None, epochs=None, steps=None)¶
其中doc_words(str列表) - 将推断出矢量表示的文档。而且我找不到任何opther选项来同时推断多个文档。
目前没有可以同时推断多个文档的选项。这是infer_vector()
(在open issue中收集)的许多愿望清单改进之一,但是没有正在进行的工作或有针对性的发布。
我不确定你的意思是“保留模型的随机状态”。我可以看到批处理的主要动机是用户方便,或通过多线程增加性能。
如果您真正想要的是确定性推理,请参阅answer in the Gensim FAQ which explains why deterministic Doc2Vec
inference isn't necessarily a good idea。 (它还包括一个关于如何强迫它的一些问题的链接,如果你决定这样做,尽管有充分的理由不这样做。)