有关字嵌入的问题,自然语言处理中的语言建模技术。问题可能涉及特定方法,例如Word2Vec,GloVe,FastText等,或者字嵌入及其在机器学习库中的使用。
在keras中使用预训练的gensim Word2vec嵌入
我在gensim训练过word2vec。在Keras,我想用它来制作句子矩阵使用那个词嵌入。由于存储所有句子的矩阵,因此空间和内存效率很低。所以......
我需要计算word2vec训练模型中每个单词的频率。我希望输出看起来像这样:术语计数苹果123004国家4432180运行620102 ...有可能......
我试图在文本分类算法中使用word2vec。我想使用word2vec创建矢量化器,我使用下面的脚本。但我不能为每个文件获得一行,而是......
我正在研究多语言单词嵌入代码,我需要训练我的英语数据并用西班牙语进行测试。我将使用Facebook的MUSE库进行单词嵌入。我正在寻找......
我正在用我自己的语料库训练一个GloVe模型,我有麻烦来保存它/以utf-8格式加载它。在这里我尝试了:从手套导入语料库,手套#data lines = [['女人','伞','...
Gensim Word2Vec从预训练模型中选择一组较小的单词向量
我在gensim中有一个大型的预训练Word2Vec模型,我希望在我的Keras模型中使用预训练的单词向量作为嵌入层。问题是嵌入尺寸很大......
我正在研究基于本文的模型,由于GlobalMaxPooling1D层不支持屏蔽,我得到一个例外。我有一个嵌入层,mask_zero参数设置为True。 ...
keras - evaluate_generator使用相同的训练数据产生不同的准确率
TL; DR我的模型训练了1个时期 - 用于测试目的。然而,当多次评估时,每次运行带有相同训练数据的evaluate_generator方法时,它都会产生不同的精度....
我有一个单词列表,如['like','Python'],我想加载这些单词的预训练手套单词向量,但手套文件太大,有没有快速的方法呢?我试过的迭代...
有没有人试图在特定领域的语料库上微调Glove嵌入?在各种NLP任务中,微调word2vec嵌入对我来说非常有效,但我想知道是否......
我使用语言模型ELMo - https://allennlp.org/elmo将我的文本数据表示为数字向量。该向量将用作简单情感分析任务的训练数据。在这......
附件是实体的链接文件。我想训练神经网络将每个实体表示为一个向量。 Attach是我训练导入pandas的代码,因为numpy中的pd import numpy为np ...
我有以下顺序模型适用于可变长度输入:m = Sequential()m.add(嵌入(len(chars),4,name =“embedding”))m.add(双向(LSTM(16,unit_forget_bias =没错,......
从python中的word2vec获取相似度矩阵(Gensim)
我使用以下python代码生成单词向量的相似性矩阵(我的词汇量大小为77)。 similarity_matrix = [] index = gensim.similarities.MatrixSimilarity(gensim.matutils ....
你有我自己的语料库,我训练了几个Word2Vec模型。对彼此进行评估并选择最佳方法的最佳方法是什么? (显然不是手动 - 我正在寻找...
根据https://code.google.com/archive/p/word2vec/:最近显示单词矢量捕获了许多语言规律,例如矢量操作矢量('Paris') - ...
Keras 1d卷积层如何与单词嵌入一起工作 - 文本分类问题? (过滤器,内核大小和所有超参数)
我目前正在使用Keras开发一个文本分类工具。它工作正常(它工作正常,我的验证准确度达到了98.7)但是我不知道如何确切地说1D-convolution ...
我正在建立一个RNN LSTM网络,根据作者的年龄(二进制分类 - 年轻/成人)对文本进行分类。似乎网络没有学习,突然开始过度拟合:红色:...
我使用gensim构建两个单词嵌入(word2vec模型)并使用model.save(model_name)命令将其保存为(word2vec1和word2vec2)两个不同的语料库(两个语料库有点...
我目前正在使用Keras模型,该模型具有嵌入层作为第一层。为了可视化彼此之间的关系和单词的相似性,我需要一个返回的函数...