使用gensim从未知向量中获取最近的向量

Question

我目前正在为学校项目实施自然文本生成器。我有一个预定长度的句子和关键字的数据集，由于gensim和GoogleNews-vectors-negative300.bin.gz，我将它们转换为向量。我训练一个递归神经网络来创建向量列表，并将其与真实句子的向量列表进行比较。因此，我尝试尽可能接近“真实”向量。

我的问题发生在我必须将向量转换回单词时：我的向量不一定在Google集中。因此，我想知道是否存在一种有效的解决方案，可以将Google集中最接近的向量设置为outpout向量。

我使用python 3和Tensorflow

非常感谢，随时询问有关该项目的任何问题

查尔斯

Answer 1

gensim方法.most_similar()（在KeyedVectors和类似的类上）也将接受原始矢量作为要搜索的“原始”。

只需确保明确命名positive参数-要组合以查找起点的目标单词/向量的列表。

例如：

gvecs = KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin.gz')
target_vec = gvecs['apple']
similars = gvecs.most_similar(positive=[target_vec,])

使用gensim从未知向量中获取最近的向量

问题描述投票：0回答：1

1个回答

最新问题

使用gensim从未知向量中获取最近的向量

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1