word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

将GloVe向量导入gensim。 UnicodeDecodeError:'utf-8'编解码器无法解码位置0的字节0xe6:无效的继续字节

我使用自己的语料库,使用https://github.com/stanfordnlp/GloVe/blob/master/demo.sh提供的代码制作了GloVe向量。因此,我同时具有.bin文件和.txt文件向量。我正在尝试...

回答 1 投票 0

如何将经过自我训练的word2vec保存到txt文件,其格式为'word2vec-google-news'或'glove.6b.50d'

[我不知道如何将经过自我训练的word2vec保存到txt文件,其格式为'word2vec-google-news'或'glove.6b.50d',其中包含标记和匹配的向量。我导出了自己的...

回答 1 投票 0

为NLP应用迭代在Numpy数组上

我有一个正在构建的Word2Vec模型,我在那里有一个大约3万个单词的vocab_list。我有一个约150k的句子列表(sentence_list)。我正在尝试从...

回答 1 投票 0

使用gensim的wmd函数进行句子聚类

我有一个句子列表。我想使用WMD(移词器的距离)将句子的相似性聚类。我正在使用gensim的word2vec模型为我的单词创建嵌入。 ...

回答 1 投票 0

如何从word2vec保存的模型中加载某些单词的矢量?

如何从先前训练的word2vec模型中找到相应的单词向量?数据= {'一个':数组([-0.06590105,0.01573388,0.00682817,0.53970253,-0.20303348,-0.24792041,0.08682659,-0 ....... >>

回答 1 投票 0

用于社交媒体评论的word2vec模型

我想分析社交媒体评论。我打算为此实现word2vec模型。有没有可用的word2vec模型用于社交媒体评论或产品评论?

回答 1 投票 1

图像中是否有word2vec的等同物?

我想知道是否有可能为图像创建密集的矢量表示,类似于您如何使用类似Word2Vec的算法创建单词嵌入的方式?我了解那里...

回答 1 投票 1

将预训练的嵌入导入到Tensorflow的嵌入特征列中

我有一个TF估算器,在其输入层使用要素列。其中之一是EmbeddingColumn,我已经对其进行了随机初始化(默认行为)。现在我想进行预训练...

回答 1 投票 0

将预训练的嵌入从gensim转移到Tensorflow嵌入特征列

我有一个TF估算器,在其输入层使用要素列。其中之一是EmbeddingColumn,我已经对其进行了随机初始化(默认行为)。现在我想进行预训练...

回答 1 投票 0

如何基于Word2Vec模型正确地对文档名称进行聚类并在文档之间找到相似之处?

我有一组文档(3000),每个文档都包含简短说明。我想使用Word2Vec模型来查看是否可以根据说明对这些文档进行聚类。我正在...

回答 1 投票 0

Gensim word2vec模型输出1000维ndarray,但ndarray最大维数为32-如何?

我正在尝试使用此1000维维基百科word2vec模型来分析某些文档。通过自省,我发现单词的向量表示是1000维numpy.ndarray,...

回答 1 投票 0

Word嵌入模型

我一直在搜索并尝试实现词嵌入模型以预测词之间的相似性。我有一个由3550个公司名称组成的数据集,其思想是用户可以提供一个新的...

回答 3 投票 0

'Word2Vec'对象没有属性'generate_training_data'

代码:从gensim.models.word2vec导入Word2Vec w2v = Word2Vec()training_data = w2v.generate_training_data(settings,corpus)错误:--------------------- ---------------------------------------...

回答 1 投票 0

Gensim Word2Vec模型通过增加时期数而变得更糟

我正在由约35.000个句子组成的数据集上构建Word2Vec模型,总共约500.000个单词。我基本上是这样建立模型的:def train_w2v_model(df,epochs):w2v_model = ...

回答 1 投票 0

gensim模型中向量值的范围

我正在使用model.wv从word2vec模型中提取单词嵌入向量。向量中每个元素的值范围是多少?导入gensim word2vec_model = gensim.models.Word2Vec ....

回答 1 投票 0

如何在具有向量的情况下将关键字聚类或获得关键字相似度

[我有一个Python字典,使用Pickle方法(通过Bert-as-Service和Google的预训练模型)存储为矢量文件,例如:(key)Phrase:(value)Phrase_Vector_from_Bert = woman cloth:1 ....

回答 1 投票 0

当目标是相同尺寸的向量时,在word2vec向量上训练的lstm的选择损失函数

我有一个lstm,我正在用作在word2vec向量上训练的序列发生器。先前的实现为所有不同的标签生成了概率分布。 ...

回答 1 投票 0

是否有可能使用gensim word2vec模型deeplearning4j.word2vec?

我是新来deeplearning4j,我想用的话向量作为分类器的输入,使句子分类。我使用python之前,在使用gensim生成矢量模型,我想...

回答 1 投票 4

在gensim的word2vec层尺寸

当我开始训练我的word2vec模型,我带有警告考虑层尺寸设置4对更高性能的多这听起来很整洁,但我找不到任何参考...

回答 1 投票 0

如何训练我自己的语料库手套算法

我试图按照此。但一些如何我浪费了很多时间没有什么用处结束了。我只是想培养我自己的语料库(〜900MB corpus.txt文件)的手套模型。我下载提供的文件...

回答 4 投票 8

© www.soinside.com 2019 - 2024. All rights reserved.