gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

无法加载因Gensimpicle相关错误训练的模型

[尝试在Windows计算机上加载由Gensim训练的word2vec模型时,出现以下错误:AttributeError:无法在 I ... 上获取属性'EpochProgress']

回答 1 投票 0

是否可以为LDA语料库中的每个文档计算文档相似度?

我正在阅读有关LDA和文档相似性的笔记本:https://www.kaggle.com/ktattan/lda-and-document-similarity在此笔记本中,一小部分文档的文档相似性...

回答 1 投票 1

Gensim模型的绘制3D图

我已经使用Gensim训练了模型。我使用PCA绘制了一个2D图,但是它并不太清楚。我想将其更改为具有缩放功能的3D。我的结果是如此密集。来自sklearn.decomposition ...

回答 1 投票 1


gensim库中的WikiCorpus是否可用于阿拉伯语Wikipedia转储?

[我看到一个在阿拉伯语维基百科转储中使用Wikicorpus的代码,并且我知道该过程将需要很长时间才能执行,我还四处寻找执行它时收到的警告...

回答 1 投票 0

无法使用gensim FastText加载模型

使用gensim.model.FastText.load()加载模型时遇到了麻烦。这是我得到的一些代码和错误:从gensim.models导入FastText类FastTextModel:def __init __(self,...

回答 1 投票 0

Gengram doc2vec对ngram的训练

我有几千个文档要在gensim doc2vec模型中使用,但是每个文档只有5克,而全文本没有它们的原始单词顺序。在doc2vec中...

回答 1 投票 1

如何使用经过培训的Gensim模型嵌入您的数据框(GoogleNews-vectors-negative300.bin)

我正在本教程中学习,其中有Quora的以下数据集:在这里,我已经清理并标记化了q1_clean和q1_clean列中的数据。现在我已经通过...

回答 1 投票 0

没有名为'gensim'的模块,但已经安装了它

我遇到此错误问题,我已经在基本(根)环境中的jupyter笔记本中运行了此脚本,日志中说已安装gensim库,并且我已运行命令!pip install gensim ...

回答 1 投票 0

是否可以更新Doc2Vec向量?

我正在与一个稳步增长的语料库一起工作。我使用在Python中实现的Doc2Vec训练我的文档向量。是否可以更新文档向量?我想使用文档向量...

回答 1 投票 0

Word2Vec比较来自具有不同大小的不同模型的向量

我已经使用gensim针对不同的语言训练了多个word2vec模型,但是每种模型的大小都不同。向量是这样获得的:vec_sp = word_vectors_sp.get_vector(“ uno”)...

回答 2 投票 3

[用Gensim(Python)提取双字母组时发生TypeError

我想使用Gensim提取并打印双字母组。为此,我在GoogleColab中使用了该代码:从gensim.models以api形式导入gensim.downloader作为模型。从gensim.corpora导入Word2Vec导入...

回答 1 投票 0

gensim WikiCorpus的问题-将chunkize别名为chunkize_serial; (__mp_main__而不是__main __?)

我对Python和编码一般还是很陌生,所以我似乎遇到了一个问题。我正在尝试运行此代码(向Matthew Mayo提供信贷,整个内容都可以在此处找到):#import warnings#warnings ....

回答 1 投票 0

Gensim的Doc2Vec-如何使用经过预训练的word2vec(单词相似性)

我没有大量的数据集来训练单词相似性,例如“热”比“冷”更类似于“温暖”。但是,我希望在相对较小的语料库〜100个文档上训练doc2vec,以便它可以...

回答 1 投票 0

在LDA中指定词汇输入

我正在尝试了解如何在我的情况下使用LDA。我有很多文档,但是我想看看如何在各个主题之间分配一组非常具体的单词和语法。有没有办法...

回答 1 投票 0

Gensim Mallet:输出没有针对几个主题的术语

下面是我使用Gensim Mallet包装器得到的输出。从这个SO链接中,我了解到LL /令牌的意思是“模型的对数相似度除以令牌总数”。 1)但是,对于少数主题...

回答 1 投票 0

gensim LDAModel提前停止

Gensim LDAModel具有参数迭代和传递参数,以控制训练时期的数量,并通过回调获取有关收敛的信息,但是有可能在...

回答 1 投票 0

将gensim.interfaces.TransformedCorpus转换为可读结果

我正在使用带有Gensims实现的包装器的Mallet LDA。现在,我想获取几个看不见的文档的主题分布,将其存储在嵌套列表中,然后将其打印出来。这是我的代码:...

回答 1 投票 0

在自然语言处理中,有没有什么好的方法可以减少词汇量?

[]在执行诸如文本分类,质量检查之类的任务时,从语料库生成的原始词汇通常太大,包含很多“不重要”的单词。我见过的最流行的方式...

回答 2 投票 1

为什么不是在gensim的“短语”工具中创建所有双字母组?

我已经使用gensim创建了一个bigram模型,并尝试获取bigram句子,但是为什么没有选择所有bigram句子呢?从gensim.models.phrases导入短语,短语短语=短语(...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.