gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

GoogleNews-vectors-negative300.bin的词汇中没有单词

[我试图查看哪种经过预训练的模型在新闻中包含常用短语,我认为GoogleNews-vectors-negative300.bin应该是一个全面的模型,但事实证明,它甚至都没有...

回答 2 投票 0

Python gensim LDA:在获取主题后将主题添加到文档中

我正在使用gensim的LDA进行主题建模。我知道如何将原始文本数据转换为语料库并获取主题。但是,在获得主题之后,可以将主题结果标记或添加回...)>

回答 1 投票 2

[加载Doc2Vec,而没有用于infer_vector的docs矢量

我有一个很大的gensim Doc2vec模型,当我从其他来源加载训练文档向量时,我只需要推断向量。没有我做的大npy文件,是否可以按原样加载它?

回答 1 投票 0

如何在gensim中的word2vec模型中嵌入用户名

[我有一些志愿者论文,其格式为:志愿者名称,论文[“ emi”,“ jenne”,“ john”],[[“ let”,“ protect”,“ nature”],[“ what”, “是”,“自然”],[“自然”,“人类”,“地球”]] [“ ...

回答 1 投票 0

从预先训练的模型中获取句子的主题

我有一个文本文件中的10个句子列表。我想使用现有的主题模型来获取每个句子的主题。在我发现的所有教程中-他们在语料库上训练了主题模型....

回答 1 投票 0

这是gensim hdp模型python 3.8的错误吗?

我想使用gensim的HDP模型来获取我的语料库的主题数,我已经使用该语料库和字典来训练gensim的常规LDA模型,并且效果很好。但是现在当我...

回答 1 投票 0

module'smart_open'没有属性'local_file'

我已经从gensim import corpora AttributeError Traceback(最近一次调用最后一次) 在 ... 解决了相同的问题,并升级了[[smart_open的版本]帮助 python -m pip install --upgrade smart_open 在使用conda的情况下,更新依赖项应该可以解决问题 conda install -c anaconda --update-deps gensim 我将smart_open降级为1.9.0并将gensim降级到3.4.0它对我有用。 几天后由于相同的错误而丢失。最后,下面的方法起作用了> 打开〜\ Anaconda3 \ lib \ site-packages \ smart_open \ transport.py您的编辑器 转到第22行,更改_REGISTRY = {NO_SCHEME:smart_open.local_file}到“ _REGISTRY = {NO_SCHEME: smart_open_lib 。local_file}“ 在文件开始处添加行导入smart_open_lib以及其他导入

回答 3 投票 1

Gensim word2vec模型是否与Mikolov的标准模型相同?

我正在执行一篇论文以比较我们的表现。在这篇论文中,uathor说了300维预训练的word2vec向量(Mikolov等人,2013),我想知道预训练的... 2>

回答 1 投票 0

ModuleNotFoundError:没有名为'gensim.corpora'的模块; 'gensim'不是软件包

我正在尝试使用gensim(特别是gensim.corpora.dictionary)处理文本,但我不断收到“ ModuleNotFoundError:没有名为'gensim.corpora'的模块;'gensim'不是软件包”错误。 ...

回答 1 投票 0

如何将详细文本映射到一个字母组合或二元组

我正在尝试找出要求的解决方案,其中要求将长文本映射为unigram或bigrams。例如,“具有激励和管理团队的能力。您应该能够跟踪...

回答 1 投票 0

CalledProcessError:返回的非零退出状态1

当我尝试运行时:def remove_stopwords(文本):返回[[如果文本不在stop_words中,则单词在simple_preprocess(str(doc))中为单词]对于文本中的文档] def make_bigrams(文本):返回[...

回答 1 投票 0

以文本格式保存word2vec

我试图将word2vec矢量另存为文本,但没有解决,我遇到一个错误,我不太了解,这里出现了什么重复以及建议的“ wv”是什么。也许某人可以...

回答 1 投票 0

通过Python + RegEx改善大文档文本标记化的性能

我目前正在尝试处理大量非常大(> 10k个单词)的文本文件。在我的数据管道中,我确定gensim标记化功能为我的瓶颈,相关部分在我的...中提供。...] >>

回答 1 投票 1

保存T-SNE结果以供将来使用

保存已通过T-SNE转换的gensim doc2vec模型的适当方法是什么(来自sklearn.manifold),例如x_full =模型[doc_tags] pca_full = PCA(n_components = 50)pca_result_full = ...

回答 1 投票 0

使用Doc2Vec训练文档时句子中句点的重要性

问题-1我正在用150000个文档训练Doc2Vec。由于这些文件来自法律领域,因此确实很难清理并将其准备好进行进一步的培训。因此,我决定删除所有...

回答 1 投票 0

使用gensim从未知向量中获取最近的向量

我目前正在为学校项目实施自然文本生成器。我有一个预定长度的句子和关键字的数据集,由于gensim和...

回答 1 投票 0

LSI模型无法加载模型

我已存储了LSI模型,并且该模型已存储为model.pkl和model.pkl.projection。但是,当我尝试加载模型时,加载失败,因为它试图查找投影...

回答 1 投票 1

还有什么解决方案可以将现有的Googlenews W2v加载到gensim并使用其他语料库进行微调吗?

为了微调gensim中的word2vec嵌入,以下代码与以前的版本一起使用:model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin.gz',binary = ...

回答 1 投票 2

Gensim word2vec下采样样本= 0

Gensim word2vec中的sample = 0是否表示在我的培训期间没有使用过下采样?文档说“有用的范围是(0,1e-5)”,但是将阈值设置为0会...

回答 1 投票 0

将快速文本模型(gensim)与线程一起使用

是否可以使用多线程访问快速文本模型(gensim)?目前,由于大小和加载时间,我试图加载一次模型,因此它保留在内存中并访问其相似性...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.