gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

LSTM 模型验证精度不遵循训练精度

我正在构建一个 LSTM 模型来对 PT-BR 中的恐同推特进行分类。我有一个包含 5k 条推文的数据集,这些推文已经在恐同和非恐同方面取得了平衡。问题是,我已经测试了三个

回答 1 投票 0

LDA Mallet Gensim CalledProcessError

似乎很多人都对 Mallet 有疑问。 导入操作系统 从 gensim.models.wrappers 导入 LdaMallet os.environ.update({'MALLET_HOME':r'C:/Users/myusername/Desktop/Topic_Modelling/mallet-2...

回答 2 投票 0

从Gensim中的二元模型或三元模型导出二元模型更正确吗?

我训练了一个二元模型和一个三元模型后,我可以从二元模型中导出二元模型。或者,我可以从三元组模型中导出二元组。我发现两个

回答 0 投票 0

“gensim.models.phrases”不再提供“伪语料库”?

几个月前,我使用“伪语料库”创建了一个假语料库,作为使用 Gensim 进行短语训练的一部分,代码如下: 从 gensim.models.phrases 导入伪语料库 语料库 =

回答 1 投票 0

如何在训练 Word2Vec 模型时跟踪完成的时期数?

我正在用我的 8gb RAM 笔记本电脑训练我的 Word2Vec 模型超过 12 个小时,以获得超过 90k 条推文(样本)的语料库,字典中约 10k 个独特的单词,用于 5 个时期。正常吗...

回答 1 投票 0

使用 pyLDAvis 可视化 LDA 模型

我在 vscode 中运行 jupyter notebook。 我已经使用 gensim 构建了我的 LDA 模型,但是当我想可视化它时,它什么也没显示。 我的代码是: 导入 pyLDAvis 导入 pyLDAvis.gensim_models pyLDAvis.

回答 0 投票 0

使用预训练的fasttext模型时,gensim如何计算句子嵌入?

根据这个答案,FastText 的句子相似度是用两种方法之一计算的(取决于嵌入是创建有监督的还是无监督的) 归一化词的均值 v...

回答 0 投票 0

使用词嵌入进行主题建模

我目前正在尝试创建一个带有词嵌入的 LDA 模型。这是代码: 从 gensim.models.ldamodel 导入 LdaModel 从 gensim.corpor.dictionary 导入字典 来自 gensim.test.ut...

回答 1 投票 0

使用 pandas 进行主题分析

所以我正在使用 gensim for LDA 对 csv 文件进行主题建模;我面临的问题是在熊猫中,这是代码 - d_s['text_clean'] = d_s['text'].apply(clean) 这是错误 PS C:\用户\

回答 0 投票 0

将 Gensim WordVectors 加载到 spacy 管道中

我用 gensim 生成了一个 Word2Vec 模型,bat 很难在我的 spacy 管道中使用它。 python -m spacy init vectors de w2v-model-v1.txt.gz 路径/SpacyModel 创建一个我可以加载的模型,但是......

回答 1 投票 0

如何在 word2vec 中使用阿拉伯语?

我正在尝试使用此链接中的 word2vec 制作图书推荐系统 https://medium.com/@ashok.1055/building-book-recommendation-system-16f2cdf615f2 当我在

回答 1 投票 0

使用Gensim进行分段故障

我目前在用gensim加载模型时,出现了分割故障。为了创建模型并保存它,我这样做: glove_file = 'QGModelsembeddingsglove.6B.300d.txt' tmp_file = '...'。

回答 1 投票 0

使用PhrasesTransformer进行短语检测。

from gensim.sklearn_api.phrases import PhrasesTransformer # 创建模型。m = PhrasesTransformer(min_count=1, threshold=3)...。

回答 1 投票 -1

gensim是如何做到如此快速地找到最相似的单词的?

比方说,我们训练一个有超过100万个单词的模型。为了找到最相似的词,我们需要计算测试词的嵌入和所有1 ... 的嵌入之间的距离。

回答 1 投票 0

由维基百科建立语料库。ModuleNotFoundError: 没有名为 "gensim "的模块

我复制了一个简单的Python脚本,通过构建自然语言处理的维基百科文本语料库来构建语料库,从文章中剥离所有维基百科标记,使用gensim。这是 ...

回答 1 投票 0

Gensim的 "model.wv.most_similar "返回语音相似的词。

gensim的wv.most_similar返回的是语音上接近的词(相似的声音) 而不是语义上相似的。这正常吗?为什么会出现这种情况?以下是关于 most_similar 的文档: ...

回答 1 投票 0

在TF-Hub上加载预训练模型,以计算Gensim或spaCy上的单词移动距离(WMD)。

我想在TensorFlow Hub嵌入上用通用句子编码器计算Word Mover's Distance,请问有没有其他方法可以将tf-Hub上的预训练模型转移到spaCy格式或word2vec格式?我试过在spaCy上用WMD-relax的例子,它从spaCy上加载'en'模型,但我 ...

回答 1 投票 1

将训练好的 gensim word2vec 模型保存为 tensorflow SavedModel。

我们是否有一个选项可以使用 tf 2.0 tf.saved_model.save 将训练好的 Gensim Word2Vec 模型保存为保存的模型?换句话说,我如何将一个训练好的嵌入向量保存为保存的模型签名,以 ...

回答 1 投票 0

是否有可能比较两个词嵌入库的相似度分数?

在我的研究中,我正在探索一组媒体与另一组媒体相比是否存在统计学意义上的意识形态偏差。我希望使用词嵌入的方法来探索这个问题。让...

回答 1 投票 0

无法导入gensim模块

我使用(pip install gensim)安装了gensim模块,安装成功 成功安装 boto-2.49.0 boto3-1.12.45 botocore-1.15.45 docutils-0.15.2 gensim-3.8.2 jmespath-0.9.5 ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.