有关字嵌入的问题,自然语言处理中的语言建模技术。问题可能涉及特定方法,例如Word2Vec,GloVe,FastText等,或者字嵌入及其在机器学习库中的使用。
我一直在搜索并尝试实现词嵌入模型以预测词之间的相似性。我有一个由3550个公司名称组成的数据集,其思想是用户可以提供一个新的...
我正在为文本分类训练RNN。我想用批处理大小X训练模型。但是,对于每个批处理,我想创建一个零填充,其中word_padding_length =最大字符串长度...
使用手套预训练glove.6B.50.txt,以此为基础的嵌入字[R
我想文本数据转换成R中使用手套的载体。我的计划是平均句子的词矢量,但我似乎无法得到这个词量化阶段。我已经下载了...
我使用Python 3.5做我的研究。我想利用手套字的嵌入的。我如何保存和glove.fit后装入我的手套模型?我已经编写它像这样glove.fit(corpus.matrix,时代= ...
在tf.keras.layers.Embedding中,为什么重要的是要知道字典的大小?
与标题相同,在tf.keras.layers.Embedding中,为什么重要的是要知道字典的大小作为输入维?
我一直在使用Keras默认在我的建筑与嵌入的嵌入字层。架构是这样的 - left_input =输入(形状=(max_seq_length,),D类= 'INT32')right_input =输入(...
无法运行Poincare Embeddings示例来获取分层表示
我正试图通过Facebook Research复制PoincaréEmbeddings用于学习Github上的分层表示。但我无法运行example.sh将哺乳动物的子树嵌入...
我在“棕色语料库”上训练了一个Word2vec模型。我想将矢量化的单词应用到一个新的文本文档中,然后我想通过Affinity Propagation聚类。进口gensim ...
我正在尝试使用tensorflow编写简单的神经机器翻译代码。但是我对理解张量流上的嵌入有些困惑:我不明白区别...
我想在训练之前加载训练前的单词嵌入,而不是每个train_steps加载它。我按照这篇文章中的步骤进行操作。但它会显示错误:您必须为占位符提供值...
作为练习,我只需要使用密集层来执行文本分类。我想利用单词嵌入,问题在于数据集然后是3D(样本,句子的单词,嵌入...
每次运行时,Google新闻Word2Vec型号都会占用存储空间吗?
这似乎是一个奇怪的问题,但我是新来的,所以我想不管怎样。我想在我的笔记本电脑上使用这个Google新闻模型来处理各种不同的文件。这意味着我将运行这个......
所以首先我在我的模型中使用GloVe它工作正常,但现在我想切换到Elmo但我总是得到错误:ValueError:Concatenate层需要输入匹配的形状,除了...
在 NLP 任务中使用 GloVe 嵌入时,数据集中的某些单词可能不存在于 GloVe 中。因此,我们为这些未知词实例化随机权重。 是否可以冷冻称重...
是否有当前模型或我如何训练一个模型,该模型采用涉及两个主题的句子:[减数分裂]是一种[细胞分裂] ...并决定一个人是孩子还是父母......
我有一个网站元描述列表(128k描述;每个有平均20-30个单词),我正在尝试建立一个相似性排名(如:给我看这个网站元的5个最相似的网站...
从页面我得到以下代码:来自keras.preprocessing.text的numpy导入数组从keras.preprocessing.sequence导入one_hot导入来自keras.models的pad_sequences顺序...
最近,我训练了一个来自sentiment140的FastText字嵌入来获得英语单词的表示。但是,今天只是为了试用,我用几个中文单词运行FastText模块,......
我有一个单词嵌入文件,如下所示点击这里查看github中的完整文件。我想知道生成单词嵌入的过程这样我就可以生成单词嵌入...
使用word2vec字嵌入作为文本分类的特征向量(类似于计数向量化器/ tfidf特征向量)
我正在尝试使用机器学习进行一些文本分类,并且我已经使用简单的单词包方法从每个处理的文本数据中提取了特征向量(计数...