gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

找出与OOV词最相似的词

我正在使用gensim寻找词汇外的OOV词的最相似词。类似这样: def get_word_vec(self, model, word): try: if word not in model.wv.vocab: ...。

回答 1 投票 0

如何计算sklearn LDA模型的一致性得分?

这里,best_model_lda是一个基于sklearn的LDA模型,我们试图找到这个模型的一致性得分... coherence_model_lda = CoherenceModel(model = best_lda_model,texts=data_vectorized,...)

回答 1 投票 1

我想再训练4个Word2vec模型,并对得到的嵌入矩阵进行平均。

我写了下面的代码,我用了Used spacy来限制tweets中的词的内容词,即名词、动词和形容词。将单词转化为小写,并将POS与......添加到一起。

回答 1 投票 0

不能从'smart_open'导入名称'open'。

我这样做,得到了这个错误:从gensim.models导入Word2Vec ImportError: cannot import name 'open' from 'smart_open' (C:\ProgramData\Anaconda3\lib/site-packages/smart_open/__init__.py) ...。

回答 1 投票 0

并行化对训练word2vec模型没有好处。

我尝试使用gensim库中实现的word2vec进行并行。我注意到,我越是增加线程,训练就越慢,我不知道为什么。有什么需要设置的吗?I ...

回答 1 投票 1

如何在gensim中删除停止符?

df_clean['message'] = df_clean['message'].apply(lambda x: gensim.parsing.preprocessing.remove_stopwords(x)) 我试着在数据帧的列 "message "上这样做,但我得到了错误。TypeError: decoding ...

回答 2 投票 0

word2vec推荐系统KeyError: "单词'21883'不在词汇中"

代码对于包含500000+实例的数据集工作绝对正常,但每当我将数据集减少到50001000015000时,它就会抛出一个关键错误:单词 "***"不在词汇中。

回答 1 投票 0

使用gensim和FastText进行单词嵌入,对预训练的向量进行训练。

我试图加载Facebook fasttext crawl-300d-2M.vec的预训练向量文件,代码如下: from gensim.models.fasttext import load_facebook_model, load_facebook_vectors model_facebook =...

回答 1 投票 0

将字数组和向量数组组合以生成Gensim W2V模型

我有一个pickle文件中的单词数组,还有一个npy文件中的对应矢量数组,如何将它们组合起来以生成Gensim W2V模型?] >>

回答 1 投票 0

gensim word2vec词嵌入如何提取1个单词句子的训练单词对?

请参考下图(word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程)。例如。 “我爱你。” ==> [[I,love),(I,you)]请问单词是什么...

回答 1 投票 0

提高DOC2VEC Gensim效率

我正在尝试在带标签的文档上训练Gensim Doc2Vec模型。我大约有4000000个文档。以下是我的代码:将pandas作为pd导入从nltk.corpus导入多处理从...

回答 1 投票 1

使用适用方法在熊猫列上使用gensim短语

我正在尝试在df的列上使用gensim短语。样本df在col1 col2下面给出1“这是test1并用于test1” 2“这是第二行的内容” 3 ...

回答 2 投票 0

与Gensim Doc2Vec最不相似

most_similar方法找到前N个最相似的词。有没有找到N个最不相似的单词的方法或方法?

回答 1 投票 0

使用Gensim保存FastText自定义模型二进制文件

我正在尝试保存使用gensim训练的自定义FastText模型。我想保存二进制文件,以便有可能再次训练模型。保存二进制文件的代码是...

回答 1 投票 0

Python Gensim木槌

我正在尝试使用Gensim的Mallet包装器在Python上将LDA应用于主题建模。我正在运行的代码如下:MALLET_PATH ='C:/mallet-2.0.8/bin/mallet'lda_mallet = gensim ....

回答 1 投票 0

[模型移至Azure Machine Learning Studio时会产生不同的结果

我们在本地计算机上开发了Jupyter Notebook,以使用python(V3)库sklearn和gensim训练模型。当我们将random_state变量设置为固定整数时,结果始终为...

回答 1 投票 1


是否有一种方法可以通过矩阵乘法从gensim LDA预训练模型中推断看不见的文档上的主题分布?

是否有一种方法可以使用预训练的LDA模型而不使用LDA_Model [unseenDoc]语法来获取未见文档的主题分布?我正在尝试将我的LDA模型实现为网络...

回答 1 投票 0

无论如何都可以多次训练doc2vec模型

我不知道如何使用doc2vec批量训练模型。由于我将所有数据加载到ram中,因此无法加载它#从gensim.models.doc2vec import Doc2Vec导入所有依赖项,...

回答 1 投票 0

将Java的gensim python与jython结合使用

我想在python代码中使用gensim库,并且需要从Java执行该代码。以下是python代码send2vec.py:import gensim句子= gensim.models.doc2vec ....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.