word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

根据字典中数组中的值获取键

我只是制作word2vec模型,并在单词(关键字)和值(向量)之间建立字典。 dictionary = dict({})for idx,键入枚举(model.wv.vocab):字典[key] = model.wv [key]字典...

回答 1 投票 0

以文本格式保存word2vec

我试图将word2vec矢量另存为文本,但没有解决,我遇到一个错误,我不太了解,这里出现了什么重复以及建议的“ wv”是什么。也许某人可以...

回答 1 投票 0

如何使用TensorFlow的通用句子编码器将向量转换回句子?

我正在使用TensorFlow的通用句子编码器,我想将生成的向量转换回句子。 TensorFlow提供了一种从句子到向量的方法,但是我想扭转这个....

回答 1 投票 0

预先训练的向量,nlp,word2vec,针对特定主题的词嵌入?

仅针对特定主题有任何预训练的向量吗?例如“ java”,所以我要在文件中找到与向量相关的java。意思是,如果我给出输入继承,则余弦相似度将显示多态性,并且...

回答 2 投票 0

使用Doc2Vec训练文档时句子中句点的重要性

问题-1我正在用150000个文档训练Doc2Vec。由于这些文件来自法律领域,因此确实很难清理并将其准备好进行进一步的培训。因此,我决定删除所有...

回答 1 投票 0

我如何安装mat2vec Python软件包?

我正在尝试安装mat2vec Python软件包(更多信息,请参见:https://github.com/materialsintelligence/mat2vec),键入通常的pip安装mat2vec。但是输出是错误:找不到...

回答 2 投票 0

使用gensim从未知向量中获取最近的向量

我目前正在为学校项目实施自然文本生成器。我有一个预定长度的句子和关键字的数据集,由于gensim和...

回答 1 投票 0

使用Word2Vec对字符串列表进行向量化,以提供给keras顺序层

我正在尝试使用fastText构建定制的单词嵌入模型,该模型将我的数据(句子列表)表示为矢量,因此我可以将其“馈送”到Keras CNN进行滥用语言检测。我的...

回答 1 投票 -1

还有什么解决方案可以将现有的Googlenews W2v加载到gensim并使用其他语料库进行微调吗?

为了微调gensim中的word2vec嵌入,以下代码与以前的版本一起使用:model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin.gz',binary = ...

回答 1 投票 2

IOError:[Error no:21]是目录:'./w2v-model/wordmodel3'

def generate_w2vModel(decTokenFlawPath,w2vModelPath):print(“ training ...”)model = Word2Vec(句子= DirofCorpus(decTokenFlawPath),大小= 30,alpha = 0.01,窗口= 5,min_count = 0,...] >

回答 1 投票 0

文档分类:预处理和多个标签

我对单词表示算法有疑问:word2Vec,doc2Vec和Tf-IDF中哪一种算法更适合于处理文本分类任务?我的......>

回答 1 投票 1

如何测量单词或简短文本之间的相似度

我正在研究在文档列表中查找最近的文档的问题。每个文档都是一个单词或一个很短的句子(例如“牛仔裤”或“机器工具”或“生物番茄”)。最接近的I ...

回答 1 投票 0

用于翻译同形异义词的文本对齐的单词向量

Homograph是一个单词,与另一个单词具有相同的书面形式,但是具有不同的含义,就像下面的句子中所说的:成功是指做出正确的决定。 ...

回答 1 投票 0

使用自动编码器实现成对的文本相似性

我有一个仅包含500个样本的数据集。数据集具有三列Sentence1 Sentence2 0或1(以表示相似性)。我的任务是训练一个使用两个句子作为输入的编码器...

回答 1 投票 1

word2vec如何正确预测单词,但实际数据集不包含该单词?

我试图了解word2vec如何预测给定单词列表的单词。具体来说,我使用以下参数在500k条推文的Twitter数据上训练了我的skip-gram模型:model = gensim ....

回答 1 投票 0

分类精度太低(Word2Vec)

我正在研究word2vec要解决的多标签情感分类问题。这是我从几个教程中学到的代码。现在精度很低。约0.02,这是...

回答 1 投票 0

[Word2Vec] [gensim]使用参数min_count处理词汇中的遗漏单词>>

关于此主题,有人提出了类似的问题,但到目前为止,我对这些答复并不十分满意;请原谅我。我正在使用python中的Word2Vec函数...

回答 1 投票 0

word2vec可以处理数字序列吗?

我对网络嵌入非常陌生,尤其是对于属性网络嵌入。目前,我正在研究node2vec算法。我认为该过程是带有p和q的RandomWalk,然后步行到...

回答 1 投票 0

您如何从同现(bigram)计数列表中训练gensim中的word2vec?

我正在尝试通过使用预先计算的二元数计数并发计数来与COHA语料一起训练word2vec模型,该语料库的作者在此处提供了该计数。如何使用gensim来实现?

回答 1 投票 1

为什么我在word2vec和TFIDF中有不同数量的术语?我该如何解决?

我需要将TFIDF矩阵中的项的宽度乘以word2vec矩阵的词嵌入,但我不能这样做,因为每个矩阵具有不同数量的项。我对...

回答 1 投票 -4

© www.soinside.com 2019 - 2024. All rights reserved.