使用手套中的训练数据为您的数据集获取单词嵌入

问题描述 投票:3回答:1

我最近在我的mac中安装了gensim和手套,并试图为我拥有的文本数据进行单词嵌入。但是,我找不到合适的功能。我只是遇到了获取两个单词之间相似度量的方法。如何使用库中存在的数据训练手套对象并使用它来获取我的数据集中的单词的嵌入?或者python中还有其他库可以执行此操作吗?谢谢!

python macos nlp
1个回答
0
投票

实际上,手套的格式与word2vec不同,你可以使用这个https://radimrehurek.com/gensim/scripts/glove2word2vec.html将手套的格式转换为word2vec格式

让转换后的手套是glove_changed.txt

import gensim model = gensim.models.KeyedVectors.load_word2vec_format('glove_changed.txt', binary=False) print(model['cat']) // This will give the wordvector for the word 'cat'

© www.soinside.com 2019 - 2024. All rights reserved.