gensim 相关问题

Gensim是一个免费的Python框架，旨在自动从文档中提取语义主题，尽可能高效（计算机方面）和无痛（人性化）。

GoogleNews-vectors-negative300.bin的词汇中没有单词

[我试图查看哪种经过预训练的模型在新闻中包含常用短语，我认为GoogleNews-vectors-negative300.bin应该是一个全面的模型，但事实证明，它甚至都没有...

python nlp gensim word2vec

回答 2 投票 0

Python gensim LDA：在获取主题后将主题添加到文档中

我正在使用gensim的LDA进行主题建模。我知道如何将原始文本数据转换为语料库并获取主题。但是，在获得主题之后，可以将主题结果标记或添加回...）>

python gensim lda

回答 1 投票 2

[加载Doc2Vec，而没有用于infer_vector的docs矢量

我有一个很大的gensim Doc2vec模型，当我从其他来源加载训练文档向量时，我只需要推断向量。没有我做的大npy文件，是否可以按原样加载它？

gensim doc2vec

回答 1 投票 0

如何在gensim中的word2vec模型中嵌入用户名

[我有一些志愿者论文，其格式为：志愿者名称，论文[“ emi”，“ jenne”，“ john”]，[[“ let”，“ protect”，“ nature”]，[“ what”， “是”，“自然”]，[“自然”，“人类”，“地球”]] [“ ...

python gensim word2vec

回答 1 投票 0

从预先训练的模型中获取句子的主题

我有一个文本文件中的10个句子列表。我想使用现有的主题模型来获取每个句子的主题。在我发现的所有教程中-他们在语料库上训练了主题模型....

nlp gensim lda topic-modeling

回答 1 投票 0

这是gensim hdp模型python 3.8的错误吗？

我想使用gensim的HDP模型来获取我的语料库的主题数，我已经使用该语料库和字典来训练gensim的常规LDA模型，并且效果很好。但是现在当我...

python-3.x time gensim python-3.8

回答 1 投票 0

module'smart_open'没有属性'local_file'

我已经从gensim import corpora AttributeError Traceback（最近一次调用最后一次）在 ... 解决了相同的问题，并升级了[[smart_open的版本]帮助 python -m pip install --upgrade smart_open 在使用conda的情况下，更新依赖项应该可以解决问题 conda install -c anaconda --update-deps gensim 我将smart_open降级为1.9.0并将gensim降级到3.4.0它对我有用。几天后由于相同的错误而丢失。最后，下面的方法起作用了> 打开〜\ Anaconda3 \ lib \ site-packages \ smart_open \ transport.py您的编辑器转到第22行，更改_REGISTRY = {NO_SCHEME：smart_open.local_file}到“ _REGISTRY = {NO_SCHEME： smart_open_lib 。local_file}“ 在文件开始处添加行导入smart_open_lib以及其他导入

gensim

回答 3 投票 1

Gensim word2vec模型是否与Mikolov的标准模型相同？

我正在执行一篇论文以比较我们的表现。在这篇论文中，uathor说了300维预训练的word2vec向量（Mikolov等人，2013），我想知道预训练的... 2>

python nlp gensim word2vec

回答 1 投票 0

ModuleNotFoundError：没有名为'gensim.corpora'的模块； 'gensim'不是软件包

我正在尝试使用gensim（特别是gensim.corpora.dictionary）处理文本，但我不断收到“ ModuleNotFoundError：没有名为'gensim.corpora'的模块；'gensim'不是软件包”错误。 ...

python-3.x gensim

回答 1 投票 0

如何将详细文本映射到一个字母组合或二元组

我正在尝试找出要求的解决方案，其中要求将长文本映射为unigram或bigrams。例如，“具有激励和管理团队的能力。您应该能够跟踪...

python-3.x nlp cluster-analysis gensim topic-modeling

回答 1 投票 0

CalledProcessError：返回的非零退出状态1

当我尝试运行时：def remove_stopwords（文本）：返回[[如果文本不在stop_words中，则单词在simple_preprocess（str（doc））中为单词]对于文本中的文档] def make_bigrams（文本）：返回[...

python gensim lda mallet

回答 1 投票 0

以文本格式保存word2vec

我试图将word2vec矢量另存为文本，但没有解决，我遇到一个错误，我不太了解，这里出现了什么重复以及建议的“ wv”是什么。也许某人可以...

python gensim word2vec

回答 1 投票 0

通过Python + RegEx改善大文档文本标记化的性能

我目前正在尝试处理大量非常大（> 10k个单词）的文本文件。在我的数据管道中，我确定gensim标记化功能为我的瓶颈，相关部分在我的...中提供。...] >>

regex python-3.x nltk gensim

回答 1 投票 1

保存T-SNE结果以供将来使用

保存已通过T-SNE转换的gensim doc2vec模型的适当方法是什么（来自sklearn.manifold），例如x_full =模型[doc_tags] pca_full = PCA（n_components = 50）pca_result_full = ...

python gensim dimensionality-reduction saving-data

回答 1 投票 0

使用Doc2Vec训练文档时句子中句点的重要性

问题-1我正在用150000个文档训练Doc2Vec。由于这些文件来自法律领域，因此确实很难清理并将其准备好进行进一步的培训。因此，我决定删除所有...

python gensim word2vec doc2vec

回答 1 投票 0

使用gensim从未知向量中获取最近的向量

我目前正在为学校项目实施自然文本生成器。我有一个预定长度的句子和关键字的数据集，由于gensim和...

python-3.x nlp gensim word2vec

回答 1 投票 0

LSI模型无法加载模型

我已存储了LSI模型，并且该模型已存储为model.pkl和model.pkl.projection。但是，当我尝试加载模型时，加载失败，因为它试图查找投影...

scikit-learn gensim latent-semantic-indexing

回答 1 投票 1

还有什么解决方案可以将现有的Googlenews W2v加载到gensim并使用其他语料库进行微调吗？

为了微调gensim中的word2vec嵌入，以下代码与以前的版本一起使用：model = Word2Vec.load_word2vec_format（'GoogleNews-vectors-negative300.bin.gz'，binary = ...

python nlp gensim word2vec embedding

回答 1 投票 2

Gensim word2vec下采样样本= 0

Gensim word2vec中的sample = 0是否表示在我的培训期间没有使用过下采样？文档说“有用的范围是（0，1e-5）”，但是将阈值设置为0会...

python math gensim word-embedding subsampling

回答 1 投票 0

将快速文本模型（gensim）与线程一起使用

是否可以使用多线程访问快速文本模型（gensim）？目前，由于大小和加载时间，我试图加载一次模型，因此它保留在内存中并访问其相似性...

python multithreading gensim fasttext

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.