word-embedding 相关问题

有关字嵌入的问题,自然语言处理中的语言建模技术。问题可能涉及特定方法,例如Word2Vec,GloVe,FastText等,或者字嵌入及其在机器学习库中的使用。

无法从快速文本的文本文件中训练。获取ValueError:空词汇表

我正在尝试使用以下代码创建嵌入的快速文本单词。从操作系统导入fasttext导入路径txt_path = path.join(“ / home / ccse / FastText_embeddings”,“ train.txt”)model = fasttext ....

回答 1 投票 0

如何在Tensorflow中移除张量中的重复值?

我最近正在处理单词嵌入,这是我现在面临的问题。我将在张量中具有重复的值。假设我在输入([[1 2 4 2 6] [...

回答 1 投票 0

无法加载tensorflow BERT预训练模型

我试图加载BERT预训练模型来执行NER任务。但是系统找不到预训练的模型文件。我在终端中使用了以下代码,该文件夹包含model.ckpt-1000000,model ....

回答 1 投票 0

有没有办法了解word2vec的输出功能?

我想了解word2vec输出中每个维度的含义。例如,如果我用一个热编码变量创建决策树,则可以准确分辨出分类中的哪个类别...

回答 1 投票 1

使用带有Gensim的西班牙语预训练模型会引发KeyError(“单词'%s'不在词汇表中”%word)

我正在努力解决以下问题:我下载了预训练的西班牙语单词嵌入模型(超过一百万个单词,西班牙语的300维单词向量),我成功加载了该模型,然后我...

回答 1 投票 0

将LSTM / GRU添加到keras张量流中的BERT嵌入中

我正在按照此代码https://github.com/strongio/keras-bert/blob/master/keras-bert.py尝试BERT嵌入。这些是代码的重要部分(第265-267行):bert_output = ...

回答 1 投票 2

用于Word2Vec模型测试的问题对(基本事实)数据集?

我正在寻找测试数据集来优化我的Word2Vec模型。我从gensim找到了一个很好的例子:gensim / test / test_data / questions-words.txt有人知道其他类似的数据集吗?谢谢!

回答 1 投票 -2

如何使用词嵌入作为CRF(sklearn-crfsuite)模型训练的特征

我想开发一个NER模型,在这里我想使用词嵌入功能来训练CRF模型。没有词嵌入功能的代码可以完美工作,但是当我将嵌入作为CRF的功能插入时...

回答 1 投票 2

在scikit-learn中使用预训练的手套词嵌入

我已经使用keras来使用预训练的单词嵌入,但是我不确定如何在scikit-learn模型上进行此操作。我也需要在sklearn中执行此操作,因为我正在使用vecstack来合奏两个...

回答 1 投票 1

如何从文本语料库构建PPMI矩阵?

我正在尝试使用SVD模型在Brown语料库上嵌入单词。为此,我想先生成一个单词-单词共现矩阵,然后将其转换为SVD矩阵的PPMI矩阵...

回答 1 投票 0

Bert句子嵌入

[我正在尝试获取Bert的句子嵌入,但是我不确定我是否能正确执行...。是的,我知道已经存在诸如bert-as-service这样的工具,但是我想自己完成...

回答 1 投票 0

查找目标单词和中心word2vec矩阵

[我已经读过并听到(在斯坦福大学的CS224中),Word2Vec算法实际上训练了两个矩阵(即,两个向量集。)这两个是U和V集,一个是单词作为目标。 ..

回答 1 投票 0

如何将经过自我训练的word2vec保存到txt文件,其格式为'word2vec-google-news'或'glove.6b.50d'

[我不知道如何将经过自我训练的word2vec保存到txt文件,其格式为'word2vec-google-news'或'glove.6b.50d',其中包含标记和匹配的向量。我导出了自己的...

回答 1 投票 0

将在SpaCy中使用预训练单词嵌入计算出的余弦相似性分数可视化

我已经使用SpaCy的预训练模型'en_core_web_lg'来找到一组值和属性之间的余弦距离。我想形象地看一个单词与另一个单词有多接近的关系...

回答 1 投票 2

为什么text2vec的RWMD模块中的距离在1到-1之间?

据我了解,伟大的text2vec软件包的dist2 RWMD功能将矩阵之间的距离计算为余弦距离。那不是1-(余弦相似度)吗?如果余弦相似度...

回答 1 投票 0

将嵌入层添加到LSTM的输入形状错误

我正在尝试向我的LSTM添加一个可预测字符的嵌入层。我尝试添加这种格式的嵌入层,num_words_in_vocab = 83 max_sentence_length = 40#建立模型:a ...

回答 1 投票 0

图像中是否有word2vec的等同物?

我想知道是否有可能为图像创建密集的矢量表示,类似于您如何使用类似Word2Vec的算法创建单词嵌入的方式?我了解那里...

回答 1 投票 1

解释Flair中的training.log(Zalando Research)

我正在使用Flair库,以查看微调(单独实现)和嵌入投影之间是否有很大的区别(在结果方面)。我的问题是...

回答 1 投票 0

单个单词具有多个类别特征的单词嵌入

我正在寻找一种在Pytorch中使用LSTM层实现单词嵌入网络的方法,以使nn.Embedding层的输入形式与单词ID向量不同。我的每个字...

回答 1 投票 0

在TensorFlow Functional API中嵌入具有200.000个不同单词的字典

我已经在Stakoverflow和有关Keras和TensorFlow嵌入的教程中检查了几个问题,但没有找到适合我的答案。我解释。我有200.000个单词的字典。使用...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.