word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

加权单词嵌入是什么意思?

在我试图实现的论文中,它说,在这项工作中,推文使用三种类型的文本表示建模。第一个是由tf-idf加权的词袋模型(术语...

回答 2 投票 7

从gensim word2Vec获取权重矩阵

我在python中使用gensim word2vec包。我想检索在跳过学习过程中学习过的W和W'权重矩阵。在我看来,model.syn0给了我......

回答 1 投票 10

哪种方式恢复doc2vec模型效率更高?

在训练doc2vec模型之后,我想在另一个模块中重用文档向量。似乎有两种方法可以实现这一点:保存模型并将doc-vectors保存为字典。我只是好奇 ...

回答 1 投票 0

在Keras实现word2vec

我想在keras中实现word2vec算法,这可能吗?我该如何适应模型?我应该使用自定义丢失功能吗?

回答 1 投票 10

使用Word2Vec的Skip-gram无法正常工作

我正在尝试构建一个word2vec相似度字典。我能够构建一个字典,但相似性没有正确填充。我在代码中遗漏了什么吗?输入样本数据......

回答 1 投票 1

doc2vec - 如何更快地推断文档向量?

我已经训练了大约2300个段落(每个2000-12000个单词)的段落向量,每个段落的矢量大小为300.现在,我需要推断大约100,000个句子的段落向量,我有...

回答 1 投票 3

doc2vec - python中doc2vec training和infer_vector()的输入格式

在gensim中,当我给一个字符串作为训练doc2vec模型的输入时,我得到这个错误:TypeError('不知道如何处理uri%s'%repr(uri))我提到了这个问题Doc2vec:.. 。

回答 1 投票 2

可视化从gensim生成的word2vec

我使用gensim在我自己的语料库上训练了doc2vec和相应的word2vec。我想用t-sne用文字来形象化word2vec。如图所示,图中的每个点都有“单词”也有......

回答 1 投票 12

使用TSNE嵌入可视化的单词不清楚

我已经从M. Baroni等人的Word Embeddings中下载了预先训练的单词嵌入模型。我想要想象句子中存在的单词的嵌入。我有两句话:sentence1 =“四......

回答 1 投票 2

如何使用word2vec训练分类器?

该代码用于生成word2vec并使用它来训练朴素贝叶斯分类器。我能够生成word2vec并成功使用相似性函数。下一步我想用...

回答 1 投票 1

Word2vec与弹性搜索文本相似性

我有大量的文本,每个文本都在快速增长。我需要实现相似性搜索。想法是将每个单词嵌入为word2vec,并将每个单词表示为规范化的...

回答 1 投票 13

Doc2Vec.infer_vector每次都会在特定的训练模型上保持不同的结果

我正在尝试遵循这里提到的官方Doc2Vec Gensim教程 - https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb我将第10行的代码修改为.. 。

回答 1 投票 6

如何使用单词的向量表示(从Word2Vec等获得)作为分类器的特征?

我熟悉使用BOW功能进行文本分类,其中我们首先找到语料库词汇表的大小,这些词汇表的大小就是我们的特征向量。对于每个句子/文件,......

回答 2 投票 15

在wordvec方法中包括分类特征和文本 - Python

我的数据混合了文本和分类功能。它看起来像:cr_id描述业务类型状态1更强大的系统需要担保贷款...

回答 1 投票 0

在Keras中进行文本分类时出错

我在Keras做文本分类。首先,我使用Word2Vec创建一个嵌入矩阵并将其传递给Keras嵌入层。然后我在它上面运行Conv1D。这是我的数据集......

回答 1 投票 1

带有Conv1D的Word2vec用于文本分类混淆

我正在进行文本分类并计划使用word2vec单词嵌入并将其传递给Conv1D图层进行文本分类。我有一个包含文本和相应标签的数据框(...

回答 1 投票 1

单词嵌入的语义加权平均值

给定一个单词嵌入向量列表,我试图计算一个平均单词嵌入,其中一些单词比其他单词更有意义。换句话说,我想计算语义加权...

回答 1 投票 2

单词向量是否意味着什么?

根据我的理解,单词向量仅用于与其他单词向量的关系。例如,“王”的单词向量减去“男孩”的单词向量应该给出一个向量关闭...

回答 2 投票 -2

Doc2vec:gensim doc2vec模型中只有10个docvecs?

我使用gensim拟合doc2vec模型,标记文档(长度> 10)作为训练数据。目标是获取所有训练文档的doc向量,但在model.docvecs中只能找到10个向量。 ......

回答 1 投票 4

Sentence2vec和Word2vec涉及停用词和命名实体

我正在研究一个涉及sentence2vec的NLP项目。我假设我将使用预先训练的字嵌入将标记转换为向量,然后继续进行句子嵌入。从......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.