gensim word2vec词嵌入如何提取1个单词句子的训练单词对?

问题描述 投票:0回答:1

请参考下图(word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程)。

例如“我爱你。” ==> [(我,爱),(我,你)]

请问当句子中只有一个单词时,单词对是什么?

是“快乐!” ==> [[happy,happy)]吗?

我在基因组学上测试了word2vec算法,当训练集中的句子中只有一个单词(并且其他句子中不包含该单词)时,word2vec算法仍然可以为该特定单词构建嵌入向量。我不确定算法如何做到这一点。

enter image description here

===============更新===============================] >

作为下面发布的答案,我认为为1-word句子中的单词创建的单词嵌入向量只是神经网络权重的随机初始化。

请参考下图(word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程)。例如。 “我爱你。” ==> [[I,love),(I,you)]请问单词是什么...

nlp text-mining gensim word2vec word-embedding
1个回答
1
投票

不可能从1个单词的句子中进行word2vec训练,因为没有邻居单词可用作预测中心/目标单词的输入。本质上,该句子被跳过。

© www.soinside.com 2019 - 2024. All rights reserved.