来自整个doc2vec模型的单词向量与来自特定文档的单词向量

问题描述 投票:0回答:1

我训练了一个gensim的Doc2Vec模型,默认的word2vec训练(dm = 1)。我可以从model.wv.vectors中的全局模型中获取单词向量。但是documentation说同一个词(例子中的“叶子”)将不会有相同的向量,这取决于它出现的文档上下文。

所以我有点困惑:在model.wv.vectors中,“离开”这个词是否会为所有用于训练模型的文件都有相同的向量(这可能与我从文档中理解的内容相矛盾) )?如果没有,如何从特定文档中获取单词向量?

gensim word2vec doc2vec
1个回答
0
投票

该文件具有误导性。单词标记'leaves'在该模型中只有一个单词向量。

我猜这个评论的作者可能意味着在PV-DM模式(dm=1)的模型训练中,训练预测会受到单词矢量和'浮动'doc-vector的组合的影响。该文本(以及上下文窗口中的其他相邻单词向量)。但是,一个词只有一个向量,而且那里的描述很混乱。

© www.soinside.com 2019 - 2024. All rights reserved.