word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

如何在图像上应用word2vec?

我一直在研究Google的word2vec模型。我能够为文本词语料库生成最多300维的向量。对于大数据而言,这是一个非常令人印象深刻的工具,准确性更高。 ...

回答 2 投票 3

在使用gensim库训练期间,Skip-gram word2vec和CBOW w2v有什么区别?

对于Skip-gram word2vec训练样本获得如下:句子:狐狸穿过枫林森林狐狸这个词给下一对训练:狐狸跑,狐狸跑,狐狸枫,狐狸-...

回答 1 投票 1

TypeError:ufunc'add'不包含带有签名匹配类型dtype的循环

我想将X_train_word2vec向量作为输入传递给Gensim Word2Vec模型。矢量类型是numpy.ndarray,例如:X_train_word2vec [9] = array([19,7,1,201,20,1,...

回答 1 投票 1

H2O Word2Vec不一致的向量

我对一个特定主题有一个普遍的问题。我使用Word2Vec生成的向量作为功能提供到我的分布式随机森林模型中,用于对某些记录进行分类。我有数百万......

回答 1 投票 0

我想根据它们的语义来对一些句子进行分类。我如何在这里使用Doc2Vec?还是有比这更好的方法?

我想对从源中提取的各种评论实现doc2vec。我想将这些评论分类到用户定义的不同类中。我怎样才能做到这一点?

回答 1 投票 0

硬Word2Vec实现

我正在使用http://adventuresinmachinelearning.com/word2vec-keras-tutorial/中的实现来学习有关word2Vec的内容。我不明白的是为什么不是损失函数...

回答 1 投票 4

如何同时将word2vec和RNN用于NLP?

我最近研究并理解了word2vec是如何工作的,它负责将单词转换为数字形式,因此当我们绘制它们或将它们放入世界空间时,它们将被传播并揭示......

回答 1 投票 -2

如何减少语义相似的单词?

我从文档中提取了大量的单词。语料库中的词语可能意思相同。例如:“命令”和“命令”意思相同,“苹果”和“申请”并不意味着......

回答 1 投票 0

Gensim:提出KeyError(“词'%s'不在词汇表中”%word)

我有这个代码,我有文章列表作为数据集。每个原始文章都有一篇文章我运行这段代码:import gensim docgen = TokenGenerator(raw_documents,custom_stop_words)#模型有......

回答 1 投票 1

如何组合彼此相似的文本问题?

我有一个200k问题的数据集,我想通过相似性/重复将它们组合在一起。我如何使用NLP /机器学习将这些问题按类似意图分组?鉴于......

回答 1 投票 -2

如何将具有6.6以上相似性的单词写入从字典到pandas中的数据帧的特定单词

我有一个word2vec字典,其中包含与给定单词相似的单词列表。示例model.most_similar(“ltd”)[('limited',0.7886955142021179),('limi',0.6512018442153931),('limite',0 ....

回答 1 投票 0

如何从pandas中的字典创建前5个关闭单词的数据框到特定单词列表

我有一个word2vec字典,给出了给定单词的顶部相似单词。我想从文件或列表中传递需要计算相似度的单词列表输入word_list = ['wan,...

回答 1 投票 2

doc2vec / gensim - 在时代中改变句子的问题

我正在尝试使用优秀的教程,在这里和这里开始使用word2vec和doc2vec,并尝试使用代码示例。我只在line_clean()方法中添加了删除标点符号,...

回答 1 投票 1

model.getVectors()。keys()是否会返回模型中的所有键

下面是一个示例代码。我正在尝试获取newfile.txt中所有单词的向量表示(文件有新闻文章)。想知道model.getVectors()。keys()是否输出所有键(...

回答 1 投票 0

可视化嵌入在tensorboard中

我使用了tensorflow脚本word2vec_basic.py并使用tf.summary保存了模型:saver = tf.train.Saver()save_path = saver.save(sess,“。/ w2v / mode.ckpt”)我用嵌入式可视化嵌入。 ..

回答 1 投票 1

word2vec模型如何与LSTM神经网络配合

我想为短信输入构建情感分类任务的深度学习模型。我的想法是使用word2vec模型来创建单词的表示。然后使用LSTM ......

回答 1 投票 0

了解word2vec中的词汇量大小

我试图理解word2vec算法,但有些问题让我很困惑。我正在使用TensorFlow中的代码。问题是我的数据大小是1.84亿字,它包含2.2 ...

回答 1 投票 0

word2vec模型由字符而不是单词组成

我试图用Gensim制作一个关于波斯语的word2vec模型,它有“空格”作为字符分隔符,我使用的是python 3.5。我遇到的问题是我给了一个文本文件作为输入,它...

回答 2 投票 1

Gensim相当于训练步骤

gensim Word2Vec是否有一个选项,相当于TensorFlow word2vec示例中的“训练步骤”:Word2Vec Basic?如果没有,gensim使用什么默认值?是gensim ...

回答 1 投票 1

NLP - 嵌入选择句子标记的“开始”和“结束”

假设我们正在训练神经网络模型来学习从以下输入到输出的映射,其中输出是名称实体(NE)。输入:欧盟拒绝德国呼吁抵制英国羔羊。 ...

回答 1 投票 5

© www.soinside.com 2019 - 2024. All rights reserved.