gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

IOError:[Error no:21]是目录:'./w2v-model/wordmodel3'

def generate_w2vModel(decTokenFlawPath,w2vModelPath):print(“ training ...”)model = Word2Vec(句子= DirofCorpus(decTokenFlawPath),大小= 30,alpha = 0.01,窗口= 5,min_count = 0,...] >

回答 1 投票 0

带有手套的主题的主题连贯性(gensim)

我正在尝试评估自制主题模型。为此,我使用主题列表(用关键字表示),并想要使用gensim.models.coherencemodel.CoherenceModel,并在语料库上调用它,...

回答 1 投票 0

运行gensim的LDA模型时出现运行时错误,该如何解决?

我发生运行时错误:RuntimeError:尝试在当前进程完成其引导阶段之前启动一个新进程。这可能意味着...

回答 1 投票 0

在具有预训练模型的gensim中,wmdistance运作良好,但n_similarity不是

[我已经使用gensim的wmdistance()函数和预先训练的模型来计算两个句子之间的距离。 [

回答 1 投票 0

Doc2Vec无监督培训

我需要在Doc2Vec的无监督培训中为我提供的2个选择的建议。场景是我有N个文档,每个文档的大小都超过3000个令牌。因此,现在用于训练的替代方法是...

回答 1 投票 0

[Word2Vec] [gensim]使用参数min_count处理词汇中的遗漏单词>>

关于此主题,有人提出了类似的问题,但到目前为止,我对这些答复并不十分满意;请原谅我。我正在使用python中的Word2Vec函数...

回答 1 投票 0

Python Gensim字典

这是我的输入(样本*)数据= [“ ['人类”,“界面”,“计算机”]“,” ['调查“,”用户“,”计算机“,”系统“,”响应“ ,'time']“,” ['eps','user','interface','system']“,” ['system','...

回答 1 投票 0

doc2vec的调整大小参数

我有一个120万个单句描述(5至50个单词)的数据集,我想将它们聚类为n个聚类。对于向量转换,我想使用doc2vec来获得120万等长向量。但是,...

回答 1 投票 0

使用gensim加载经过训练的快速文本模型时出现的问题

我正在尝试使用gensim加载经过训练的快速文本模型。该模型已经过一些数据训练。之前,我使用了带有.bin扩展名的model.save()以便以后使用。训练后...

回答 1 投票 0

带有很多标点符号的Gensim短语处理语句

现在,我正在尝试使用gensim短语,以便根据自己的语料库学习短语/特殊含义。假设通过删除标点符号和停用词,我有了与汽车品牌相关的语料库,...

回答 1 投票 0

试图利用一个库来进行一些主题建模,但是进展不顺利

我有一个.csv术语文档矩阵,我想使用gensim在python中执行一些潜在的dirichlet分配。但是,我对Python或LDA并不是特别熟悉。我在gensim中发布了……

回答 1 投票 -1

试图利用一个库来进行一些主题建模,但是进展不顺利

我有一个.csv术语文档矩阵,我想使用gensim在python中执行一些潜在的dirichlet分配。但是,我对Python或LDA并不是特别熟悉。我在gensim中发布了……

回答 1 投票 0

如何使用python绘制单词嵌入的k均值聚类的输出?

我已经使用gensims词嵌入法来找到每个词的向量。然后,我使用K均值来查找单词簇。有接近10,000个标记/单词,我想对其进行绘图。我想绘制...

回答 1 投票 0

您如何从同现(bigram)计数列表中训练gensim中的word2vec?

我正在尝试通过使用预先计算的二元数计数并发计数来与COHA语料一起训练word2vec模型,该语料库的作者在此处提供了该计数。如何使用gensim来实现?

回答 1 投票 1

导入Gensim gensim.models.phrases导入短语失败,并显示“ ImportError:无法导入名称'Type'”]

我在虚拟环境中使用Python版本3.5,并且尝试导入以下命令时,我从gensim.models.phrases import Phraser I中收到“ ImportError:无法导入名称'Type'”。]

回答 1 投票 0

如何加快word2vec相似度计算?

我使用Gensim训练了Word2Vec模型,我有两组单词:S1 = {'','',''...} S2 = {'','',... ...}在S1中找到单词w1,我想找到与w1最相似的前5个单词。我是...

回答 1 投票 0

在gensim LDA模型上失败的Scikit-Learn GridSearchCV

这是用于创建模型的代码:import gensim NUM_TOPICS = 4 ldamodel = gensim.models.ldamodel.LdaModel(corpus,num_topics = NUM _TOPICS,id2word = dictionary,passes = 100)ldamodel.save('model5 ....

回答 1 投票 0

Gensim行数据框摘要

我正在使用'Gensim'生成我拥有的不同行的摘要。原始数据帧如下所示:df.head()示例内容0他们不满意...

回答 1 投票 0

无法从其vector_ngrams复制经过训练的单词向量

只是出于好奇,但是我正在调试gensim的FastText代码,以复制单词外(OOV)单词的实现,但我无法实现。因此,我正在遵循的过程...

回答 1 投票 0

将gensim LDA模型保存到ONNX

是否可以将gensim LDA模型保存为ONNX格式?我们需要能够使用Python / gensim进行训练,然后将其实现为Onnx模型以进行发布和使用。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.