[我正在尝试通过使用语料库作者提供的COHA corpus预先计算的bigram计数共现计数来训练带有here的word2vec模型。>
如何使用gensim来实现?
我正在尝试通过使用预先计算的二元数计数并发计数来与COHA语料一起训练word2vec模型,该语料库的作者在此处提供了该计数。如何使用gensim来实现?
Gensim的Word2Vec
类希望其训练语料能够对实际文本(单词表)进行迭代。最内层的训练循环(其中skip-gram算法对上下文窗口内的单词对起作用)并未考虑允许您提供更多原始语料库变体的因素。