我使用以下代码将手套向量用于单词嵌入
from gensim.scripts.glove2word2vec import glove2word2vec #line1
glove_input_file = 'glove.840B.300d.txt' #line2
word2vec_output_file = 'glove.word2vec' #line3
glove2word2vec(glove_input_file, word2vec_output_file) #line4
from gensim.models import KeyedVectors #line5
glove_w2vec = KeyedVectors.load_word2vec_format('glove.word2vec', binary=False) #line6
我了解这段代码是针对您的单词嵌入使用手套式预训练矢量。但是我不确定每一行中正在发生什么。为什么要将手套转换为word2vec格式? KeyedVectors.load_word2vec_format到底能做什么?
gensim
KeyedVectors.load_word2vec_format()
方法可以将word2vec.c
格式的向量加载到KeyedVectors
(或其相同接口子类之一)的实例中,以便于查找和其他常见的词向量操作。