您如何从同现(bigram)计数列表中训练gensim中的word2vec?

问题描述 投票:1回答:1

[我正在尝试通过使用语料库作者提供的COHA corpus预先计算的bigram计数共现计数来训练带有here的word2vec模型。>

如何使用gensim来实现?

我正在尝试通过使用预先计算的二元数计数并发计数来与COHA语料一起训练word2vec模型,该语料库的作者在此处提供了该计数。如何使用gensim来实现?

python gensim word2vec
1个回答
0
投票

Gensim的Word2Vec类希望其训练语料能够对实际文本(单词表)进行迭代。最内层的训练循环(其中skip-gram算法对上下文窗口内的单词对起作用)并未考虑允许您提供更多原始语料库变体的因素。

© www.soinside.com 2019 - 2024. All rights reserved.