gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

ModuleNotFoundError:没有名为“numpy.testing.decorators”的模块

我真的需要一些帮助,因为我已经浏览了所有帖子,但没有任何效果。导入 gensim 而不是 numpy 时出现此错误(numpy 是之前的并且工作正常)。我只想导入

回答 1 投票 0

如何为 DL4J 导出带有 Ngram 权重的 Gensim Word2Vec 模型?

我对 nlp 很陌生。我正在尝试使用 dl4j 中的 gensim 训练的模型。我正在保存模型 w2v_model.wv.save_word2vec_format(“路径/到/w2v_model.bin”,二进制= True) 然后……

回答 1 投票 0

Python:“Doc2Vec”对象没有属性“dv”

感谢您的建议,我已经编辑了问题 我遇到这个: AttributeError: 'Doc2Vec' object has no attribute 'dv' 错误来自 回溯(最近一次调用最后一次): 文件“F:\Projects\项目代码\

回答 2 投票 0

训练 Fasttext 模型

我想使用“gensim”库在 Python 中训练 Fasttext 模型。首先,我应该将每个句子标记为其单词,从而将每个句子转换为单词列表。那么,这个……

回答 2 投票 0

如何在gensim中获得过滤后的二元组的分数?

给定文档单词列表,例如[['cow','boy','hat','mat],['village','boy','water','cow']....], gensim 可用于获取二元模型如下: 二元组 = gensim.models.Phrases(data_words, min_co...

回答 2 投票 0

如何加载预训练的Word2vec模型文件并重复使用?

我想使用预训练的word2vec模型,但我不知道如何在python中加载它。 该文件是一个模型文件 (703 MB)。 可以在这里下载: http://devmount.github.io/GermanWordEmbeddings/

回答 4 投票 0

Gensim 3.8.0 至 Gensim 4.0.0

我使用 Gensim 3.8.0 训练了 Word2Vec 模型。后来我尝试在GCP上使用Gensim 4.0.o来使用预训练模型。我使用了以下代码: 模型 = KeyedVectors.load_word2vec_format(wv_path,

回答 4 投票 0

主题连贯性(w2v)及其趋势?

我尝试使用w2v主题连贯性分数来评估基于NMF的主题模型。 下面是我计算的 w2v 相干性。 我想知道,w2v 相干性越高越好吗? 另外,为什么

回答 1 投票 0

如何使用gensim获取LDA模型中主题的后验概率?

我想在 Bybee、Leland 和 Kelly、Bryan T. 和 Manela、Asaf 和 Xiu、Da Cheng、《商业新闻和商业周期》(即将发表在《金融杂志》上)中应用“贝叶斯因子”方法。

回答 1 投票 0

在 gensim word2vec 模型中所有相似性都为正是正常的吗?

在一系列汉字上实现标准的gensim word2vec模型(连续词袋),以及(中文同音词和相似频率词之间的比较)我们的余弦

回答 1 投票 0

什么是对 Word2vec 生成的平均向量的良好替代品

我的数据集采用以下格式,其中对于每种疾病,我使用 word2vec 生成 2D 向量。(例如显示 2D 向量,但实际上,向量为 100D ) 疾病...

回答 1 投票 0

如何从 gensim W2V 模型获取所有向量的转储?

使用 KeyedVectors 对象,我可以得到 W2V 向量,给定一个单词,就像这样。 从 gensim.models 导入 KeyedVectors 模型 = KeyedVectors.load('vectors.kv') model.get_vector('example') # 输出 =...

回答 1 投票 0

使用 Word2Vec 进行向量化时传递到 MultinomialNB 的数据中的负值

我目前正在开发一个项目,尝试将 Word2Vec 与多项式朴素贝叶斯 (MultinomialNB) 结合使用来进行精度计算。 将 pandas 导入为 pd 将 numpy 导入为 n...

回答 1 投票 0

Word2Vec - 在训练数据或整个数据上进行训练

我希望创建一个 word2vec 模型并希望在我的本地数据上训练它。所以,问题是,我应该在整个数据上训练 word2vec 模型,还是应该将数据分成训练和测试,然后......

回答 1 投票 0

导入gensim和折旧警告

我正在导入gensim并在pip安装后出现以下错误: 219:CryptographyDeprecationWarning:Blowfish 已被弃用“class”:algorithms.Blowfish, 我该如何纠正...

回答 1 投票 0

继续训练 Doc2Vec 模型

Gensim 的官方教程明确指出可以继续训练(加载的)模型。我知道根据文档,不可能继续训练模型......

回答 2 投票 0

长文本主题建模差异

我有一些很长的文档。他们的总体主题相当标准,但每个文档都会以不同的方式强调主题,并且在这些主题中它们将有不同的子主题......

回答 1 投票 0

如何在gensim doc2vec中获取与标记文档最相似的单词

我训练了一个doc2vec模型。 doc2vec = Doc2Vec(向量大小= 300, 窗口=10, 最小计数=100, dm=1, 纪元=40) doc2vec。

回答 1 投票 0

在Python中按组有效地标记和总结文本数据

我有一个 Python 数据集,如下所示: 数据 = pd.DataFrame({ 'ID': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], '文本': [ “令人垂涎欲滴的烧烤排骨奶酪,还有

回答 1 投票 0

运行时错误:Cython 扩展不可用

我已经安装了cython和gensim。但是,当我导入 genism 时,会出现以下情况: 回溯(最近一次调用最后一次): 文件“C:\Users\DSP\untitled3\lib\site-packages\gensim\matutil...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.