gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

为什么同一迭代的不同运行会产生不同的结果?

我用Gensim LDA模型创建了具有文档主题概率的字典。字典上的每次迭代(即使使用相同的精确代码)也会产生稍有不同的值。为什么是...

回答 1 投票 0

如何通过回调函数中断Word2vec培训?

我正在使用gensim word2vec训练一个skipgram模型。我想先退出训练,然后再在不同的...

回答 1 投票 -1

gensim模型中向量值的范围

我正在使用model.wv从word2vec模型中提取单词嵌入向量。向量中每个元素的值范围是多少?导入gensim word2vec_model = gensim.models.Word2Vec ....

回答 1 投票 0

什么是gensim的fasttext默认?

我无法找到有关此gensim fasttext参数的默认值什么或者他们一样的原始Facebook的fasttext实施?

回答 1 投票 0

我如何才能找到在两个不同的文本文件语义相似款(两个文件)

我发现很多类似的问题没有人回答我的问题,有人可以帮助我。我有两个法律文件,我需要找到其与视频内容相同或具有相同的含义应该是什么我的...

回答 1 投票 0

我得到比我的文档大小的详细矢量 - gensim doc2vec

我有蛋白质序列,并希望做doc2vec。我的目标是为每个句子/序列的一个载体。我有1612句/序列和30类,这样的标签是不是唯一的,许多文件...

回答 1 投票 0

是否有可能使用gensim word2vec模型deeplearning4j.word2vec?

我是新来deeplearning4j,我想用的话向量作为分类器的输入,使句子分类。我使用python之前,在使用gensim生成矢量模型,我想...

回答 1 投票 4

在gensim的word2vec层尺寸

当我开始训练我的word2vec模型,我带有警告考虑层尺寸设置4对更高性能的多这听起来很整洁,但我找不到任何参考...

回答 1 投票 0

如何训练我自己的语料库手套算法

我试图按照此。但一些如何我浪费了很多时间没有什么用处结束了。我只是想培养我自己的语料库(〜900MB corpus.txt文件)的手套模型。我下载提供的文件...

回答 4 投票 8

如何解决“ValueError异常(‘输入必须有一个以上的句子’)”错误

我写脚本中使用美丽的汤,需要一个网站的网址,并下载它。然后,它使用gensim.summarization来概括文本,但我不断收到ValueError异常(“输入必须有不止一台...

回答 1 投票 1

了解gensim word2vec的most_similar

我不确定我应该如何使用gensim的Word2Vec的most_similar方法。比方说,你要测试的尝试和真实的例子:男子站在国王的女人站在以X;找到X.我认为这是...

回答 1 投票 0

解析鸣叫的列表,以便利用Gensim Word2Vec

我工作的一个NLP的问题,我的目标是能够通过Python的Gensim库已经使用Word2Vec后通过我的数据转换成sklearn的交易算法。潜在的问题我试图解决的是...

回答 1 投票 0

如何加载预先训练doc2vec模型,并用它的载体

有谁知道我应该使用哪种功能,如果我想在这个网站https://github.com/jhlau/doc2vec使用预先训练doc2vec模式?我知道我们可以使用Keyvectors.load_word2vec_format()...

回答 2 投票 0

什么是相似性得分在gensim similar_by_word功能?

什么是相似性得分在genism similar_by_word功能?我正在读在这里对genism similar_by_word功能:https://radimrehurek.com/gensim/models/keyedvectors.html的...

回答 1 投票 0

我如何才能找到并从文件打印无与伦比/不同的话?

我试图重写算法,基本上需要输入文本文件,并用不同的文件进行比较,结果相似。现在我想打印的无与伦比的单词和输出输出...

回答 1 投票 0

Gensim预测输出字函数语法

你如何使用Gensim预测输出字功能?模型= KeyedVectors.load_word2vec_format(” ./了Googlenews向量-negative300.bin',二进制= TRUE)model.predict_output_word([ '你好', '怎么样', '你'],...

回答 1 投票 0

火炬的预期输入使用来自gensim的预训练矢量嵌入图层

我想在我的神经网络架构中使用预先训练的嵌入。预先训练的嵌入物由gensim训练。我找到了这个信息丰富的答案,表明我们可以加载......

回答 1 投票 2

如何从gensim打印LDA主题模型?蟒蛇

使用gensim我能够从LSA中的一组文档中提取主题但是如何访问从LDA模型生成的主题?打印lda.print_topics(10)时,代码给出了......

回答 9 投票 15

使Python Gensim搜索功能高效

我有一个具有文本列的DataFrame。我根据另一列中的值将DataFrame拆分为两部分。其中一个部分被索引到gensim相似性模型中。另一个 ...

回答 1 投票 0

对于完全相同的单词,idf结果是不同的

我在python中运行tfidf模型。 texts = [** tokenized words **] dictionary = corpora.Dictionary(texts)corpus = list(map(dictionary.doc2bow,texts))test_model = models.TfidfModel(corpus)corpus_tfidf = ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.