word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

如何使用具有大量文本文档的Gensim / Word2Vec / Doc2Vec进行监督学习?

我有一组带有标签(喜欢/不喜欢)的文本文档(2000多个)。每个文档包含200多个单词。我正在尝试对这些文档进行有监督的学习。我的方法是:向量化...

回答 1 投票 0

word2vec句子边界处的窗口大小

我正在使用word2vec(和doc2vec)来获取句子的嵌入,但是我想完全忽略单词顺序。我目前正在使用gensim,但如有必要可以使用其他软件包。例如,我的...

回答 1 投票 0

将单词嵌入到word2vec gensim模型中

我正在寻找一种将预先训练的单词向量动态添加到word2vec gensim模型的方法。我在txt中有一个经过预训练的word2vec模型(单词及其嵌入),我需要获取Word Mover的...

回答 1 投票 5

Gensim Word2vec模型参数调整

我正在研究Word2Vec模型。有什么方法可以获取其参数之一的理想值,即iter。就像我们在K均值(Elbo曲线图)中使用do来获取K值的方式一样。或者是否还有其他...

回答 1 投票 0

Gensim word2vec模型损失在几个时期后变为0

正在尝试建立gensim word2vec模型。语料库包含100万个句子。我使用回调在每个时期后打印丢失。在几个时期之后,损耗变为零。知道为什么损失变为0吗? ...

回答 1 投票 0

使用embedding_vector实现Word2Vec模型时出错

是,gensim的KeyedVectors抽象不提供get()方法。 (您遵循的是什么文档或示例表明确实如此?)

回答 2 投票 0

Word2Vec Wordvector最相似

我训练了一个Word2Vec模型,我正在尝试用数学方法拟定most_like函数。我考虑了一个集合,其中包含n个最相似的词,并给出了一个词作为参考。存在...

回答 1 投票 0


如何选择以k均值表示最大频率的聚类

我从Gensim word2vec创建了一个k均值聚类,其中k的值为3。现在我想检索该聚类以及频率最高的值。从gensim.models导入gensim ...

回答 1 投票 0

了解Gensim Word2Vec 3个单词的most_like结果

我以不同的方式使用3个单词“ 1”,“ 2”,“ 3”构造句子,并观察到这些单词中每个单词的单词向量均未改变。以下是不同的句子类型1:[[“”“,” 2“ ...

回答 1 投票 0

我可以在哪里下载预训练的word2vec地图?

我一直在学习NLP模型并遇到了单词嵌入的问题,并看到了一些示例,在这些示例中可以通过计算单词的点积等来查看单词之间的关系。我是什么...

回答 1 投票 0

存储处理过的文本数据以流式传输到gensim的最佳方法?

我有几百个熊猫数据帧,每个数据帧都有一列很长的字符串,在使用word2vec建模之前,需要对其进行处理/识别,最后进行标记化。我可以存储...

回答 1 投票 0

我有一个数据集,我想在该数据集上使用NLP进行短语提取,但我无法这样做?

[如何使用具有句子Sentence1形式的一组句子和相应标签的数据集从句子中提取短语:我想玩板球Label1:播放板球Sentence2 ......

回答 1 投票 0

看不见的单词的Gensim Doc2Vec infer_vector取决于这些单词中的字符

Gensim Doc2Vec infer_vector对带有看不见单词的段落会生成矢量,这些矢量会根据未读单词中的字符而有所不同。对于范围(0,2)中的i:print(model.infer_vector([“ zz”])[0:2])...

回答 1 投票 0

对于给定的单词,预测聚类并从聚类中获取最近的单词

我已按照给出此链接的说明对w2v和k-means进行了语料库培训。 https://ai.intelligentonlinetools.com/ml/k-means-clustering-example-word2vec/我要执行的操作a。 ...

回答 1 投票 0

为word2vec实现处理语料库

作为类项目的一部分,我试图用Python编写word2vec实现并将其训练在约6GB的语料库上。我正在尝试编写合理优化的解决方案,因此不必让我的PC ...

回答 1 投票 0

Word2Vec-如何摆脱“ TypeError:不可哈希类型:'list'”和“ AttributeError:dlsym(0x7fa8c57be020,AttachDebuggerTracing):未找到符号”?

[获取TypeError:无法散列的类型:'列表'和AttributeError:dlsym(0x7fa8c57be020,AttachDebuggerTracing):当我基于...的Word2Vec实现创建模型时,找不到符号错误]

回答 1 投票 0

Gensim Word2Vec或FastText从频率构建vocab

我不知道gensim中的.build_vocab_from_freq()函数实际上是做什么的?不使用时有什么区别?谢谢!

回答 1 投票 0

是否有能够检测短语的预训练word2vec模型

是否存在任何预训练的word2vec模型,其数据包含单个单词或多个单词,例如'drama','drama_film'或'africanamericancommunity'。有没有这样的模型...

回答 1 投票 0

Deeplearning4j Word2Vec构建器种子

在此页面中(http://deeplearning4j.org/docs/latest/deeplearning4j-nlp-word2vec),此代码段被提及为log.info(“ Building model ....”); Word2Vec vec =新的Word2Vec.Builder(...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.