gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

Gensim Word2Vec从预训练模型中选择一组较小的单词向量

我在gensim中有一个大型的预训练Word2Vec模型,我希望在我的Keras模型中使用预训练的单词向量作为嵌入层。问题是嵌入尺寸很大......

回答 2 投票 2

如何从gensim中的Word2Vec模型中完全删除单词?

给定一个模型,例如来自gensim.models.word2vec导入Word2Vec文档= [“实验室abc计算机应用程序的人机界面”,“用户对计算机系统响应时间的意见调查”,...

回答 4 投票 10

有没有办法从KeyedVectors词汇中删除一个单词?

我需要从“gensim.models.keyedvectors.Word2VecKeyedVectors”的词汇中删除一个无效的单词。我尝试使用del model.vocab [word]删除它,如果我打印model.vocab这个词......

回答 2 投票 2

处理模型中未找到的gensim中的新单词

假设我试图使用distance()计算单词和文档之间的平均距离,或者使用n_similarity()计算两个文档之间的余弦相似度。但是,让我们说这些......

回答 2 投票 0

我可以将单热编码向量而不是原始句子直接输入到PYTHON模块word2vec.Word2Vec中吗?

例如,我已经将所有单词和数字转换为单热编码。然后从gensim.models导入word2vec,我想使用word2vec.Word2Vec(sentences = one_hot_vectors)...

回答 1 投票 0

PyTorch / Gensim - 如何加载预训练的单词嵌入

我想将带有gensim的预训练word2vec嵌入到PyTorch嵌入层中。所以我的问题是,如何将gensim加载的嵌入权重加到PyTorch嵌入层中。 ...

回答 5 投票 15

微调预训练的word2vec谷歌新闻

我目前正在使用Google新闻语料库训练的Word2Vec模型(从这里开始)因为这只是在2013年之前接受新闻培训,我需要更新向量并在词汇表中添加新单词...

回答 2 投票 2

如何使用词汇表约束加载word2vec txt文件

我有一个标准格式的word2vec文件,但它有2M项目。我还有一个词汇表文件,其中每行是一个单词,该文件大约有~800K行。现在我想加载嵌入...

回答 1 投票 0

如何训练一个模型,导致两个新闻标题之间的相似性得分?

我正在尝试建立一个假新闻分类器,我在这个领域很新。我有一个专栏“title_1_en”,其中包含假新闻的标题和另一个名为“title_2_en”的专栏。有3个目标......

回答 1 投票 0

如何在gensim中使用mallet设置主题模型的随机种子?

我一直试图通过使用mallet作为gensim中的库来保持主题建模的输出稳定。但是,我发现槌可以设置随机种子,但我没有在gensim中看到任何参数...

回答 2 投票 1

如何在使用Doc2vec后解释集群结果?

我正在使用doc2vec来转换我的追随者在矢量表示中的前100条推文(比如说v1 ..... v100)。之后我使用矢量表示来做K-Means聚类。 model = ...

回答 3 投票 0

使用gensim加载一部分Glove向量

我有一个单词列表,如['like','Python'],我想加载这些单词的预训练手套单词向量,但手套文件太大,有没有快速的方法呢?我试过的迭代...

回答 1 投票 0

python gensim word2vec给出typeerror TypeError:类型为'generator'的对象在自定义数据类上没有len()

我试图让word2vec在python3中工作,但是因为我的数据集太大而不能轻松适应内存我通过迭代器(来自zip文件)加载它。但是,当我运行它时,我得到错误...

回答 1 投票 0

在维基百科上找到预训练的doc2vec模型或谷歌新闻等大型文章数据集?

我很难在doc2vec模型上训练维基百科转储,没有经验将服务器设置为本地机器是不可能的,因为它需要进行培训。我找不到......

回答 1 投票 0

Gensim的Word2Vec没有提供培训提供的文件

我正在使用Word2Vec面临Gensim培训问题。 model.wv.vocab没有从训练过的语料库中得到任何进一步的单词,只有来自初始化指令的单词!在......

回答 1 投票 1

gensim错误:没有名为gensim的模块

我试图导入gensim。我有以下代码导入gensim model = gensim.models.Word2Vec.load_word2vec_format('./ model / GoogleNews- vectors-negative300.bin',binary = True)我得到了......

回答 5 投票 16

Gensim在Windows上:C扩展未加载,训练会很慢

我正在尝试使用来自gensim的word2vec,但是我在运行时收到此警告: - C:\ Users \ user1PycharmProjects \ FirstTest \ venv \ lib \ site-packages \ gensim \ utils.py:1212:UserWarning:检测到Windows; ...

回答 1 投票 2

让Gensim FAST_VERSION在Windows 10上运行(Python 3.6)

我在Windows 10上使用Python 3.6运行Gensim。我尝试安装Visual Studio 2019和MinGW(通过TDM-GCC)。我在两次安装后都卸载并重新安装了Gensim。我也 ...

回答 2 投票 1

动态主题模型的评估

我尝试评估我的动态主题模型。该模型使用gensim包装器生成。是否有任何可能的功能,如困惑或主题一致性等于“正常”主题建模?

回答 2 投票 1

如何预测Gensim主题建模的测试数据

我已经使用Gensim LDAMallet进行主题建模,但我们可以用什么方式预测样本段落并使用预训练模型获得主题模型。 #构建bigram和trigram模型bigram = ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.