word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

使用node2vec创建嵌入

我正在尝试为使用networkx和node2vec的边缘列表创建嵌入。我的边缘列表如下所示:1 2 1 6 ... 450 230 ... 601 602这是一个未加权的无向图,基本上......

回答 1 投票 1

word2vec向量的Keras输入规范

我阅读了有关此主题的所有其他答案,但我的用例略有不同。我有一个numpy阵形(800,128,1)。 800个元素中的每个元素都存储了一个word2vec嵌入...

回答 1 投票 0

如何在Keras中使用数组列表指定一个嵌入层的输入?

我正在尝试做一些单词级别的文本生成并坚持使用以下问题:我的输入看起来像这样:tokenized_seq = [[w2v_model.wv.vocab [word] .index for w2v_data [i]中的单词] for i in ...

回答 1 投票 1

如何处理 文本生成中的标记

在我的文本生成数据集中,我已将所有不常用的单词转换为令牌(未知单词),正如大多数文本生成文献所建议的那样。但是,在培训RNN时要考虑部分......

回答 2 投票 -2

我如何在google colab中解压缩预训练的word2vec?

我试图在colab中使用google,GoogleNews-vectors-negative300.bin.gz的预训练单词向量,但我不知道如何解压缩文件。 import gzip f = gzip.open('gdrive / My Drive / Colab Notebooks / ...

回答 1 投票 0

单词A和B之间的语义相似性:语料库中A和B频率的依赖性?

背景:给定一个语料库我想用word2wec(Gensim)的实现来训练它。想知道2个令牌之间的最终相似性是否依赖于A和B的频率......

回答 3 投票 1

word2vec包中函数word2vec的输入文件格式是什么?

我正在尝试使用包word2vec(https://pypi.org/project/word2vec/)进行自己的单词嵌入。但是,我找不到函数“word2vec”的输入文件的文件格式。我试过了 ....

回答 1 投票 0

Doc2vec预测 - 我们是否对新段落的单词或段落ID进行平均?

我知道您在训练期间将段落ID视为doc2vec中的新词(DM方法,图中左侧)。训练输出是上下文单词。模型训练完毕后,假设我......

回答 2 投票 1

在keras中使用预训练的gensim Word2vec嵌入

我在gensim训练过word2vec。在Keras,我想用它来制作句子矩阵使用那个词嵌入。由于存储所有句子的矩阵,因此空间和内存效率很低。所以......

回答 2 投票 5

决定文本或句子在内容上是等同的

确定相似度作为距离Word Mover距离的经典示例,例如https://markroxor.github.io/gensim/static/notebooks/WMD_tutorial.html,GoogleNews上的word2vec模型-...

回答 1 投票 0

node2vec是否支持负边权重?

node2vec是否为负权重的边提供支持?我有一个边缘列表,其中有几个边是负值的,但我很奇怪在运行代码时得到ZeroDivisionError。那里 ...

回答 1 投票 1

如何在python中安装恼人时修复错误

我在python 3.5-3.2 Windows 10中安装恼人来创建similarities.index。这是带有Python绑定的C ++库。我这样做:pip install annoy。在步骤c ++翻译我收到错误:...

回答 1 投票 0

如何在doc2vec DBOW中与段落向量共同训练单词向量?

我不明白在DBOW模式下使用gensim的doc2vec(dm = 0),在训练过程中如何使用单词向量。我知道默认情况下它被禁用,dbow_words = 0。但是当......时会发生什么

回答 1 投票 0

'Word2Vec'对象没有属性'index2word'

我收到此错误“AttributeError:'Word2Vec'对象在python中的以下代码中没有属性'index2word'”。谁知道我怎么解决它?实际上“......

回答 1 投票 1

如何找到一个文本类似于另一个文本的部分?

我们知道如何通过Word Mover的距离来评估两个整个文本的相似性。如何找到一个与另一个文本相似的文本?

回答 1 投票 0

如何预测给定句子在语法上是否正确?

我正在尝试创建一个预测模型,其中模型通过检查句子中单词的顺序来判断给定句子是否正确。该模型检查天气特定...

回答 1 投票 0

如何删除有关使用Word2vec gensim \ matutils.py:737的gensim警告

我发现word2vec.similarity()的警告如下:> d:\ python \ lib \ site-packages \ gensim \ matutils.py:737:FutureWarning:将issubdtype的第二个参数从`int`转换为`np。 ...

回答 1 投票 2

阅读GoogleNews-vectors-negative300.bin文件时,权限被拒绝错误

我正在尝试阅读不同的语言编码模型,如golve,fasttext和word3vec,并检测讽刺,但我无法阅读谷歌的语言编码文件。它正在给予许可......

回答 1 投票 0

如何判断两个自然语言查询是否具有相同的含义

我正在构建一个系统来将自然语言问题转换为SQL查询。现在我正在实施的是对自然语言问题的重构更加结构化,以便我将......

回答 1 投票 0

如何在Word2Vec的训练模型中计算单词频率?

我需要计算word2vec训练模型中每个单词的频率。我希望输出看起来像这样:术语计数苹果123004国家4432180运行620102 ...有可能......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.