word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

如何使用word2vec和CNN对罗马乌尔都语文本进行分类?

我打算使用word2vec和任何深度学习(CNN)方法(例如LSTM)在Roman Urdu数据集上执行文本分类。在罗马乌尔都语中,英语字母用于传达...

回答 1 投票 0

窗口如何影响跳跃语法的准确性?

我想知道跳跃语法模型的window_size如何影响单词嵌入中预测相似单词的准确性。在什么情况下精度会下降或上升。谢谢。

回答 1 投票 0

使用Kmeans和Word2Vec进行文本聚类时的关键错误

我通过使用Word2Vec生成的单词向量执行KMeans聚类时遇到关键错误。请帮我解决这个问题。提前致谢。我的代码如下:...

回答 1 投票 0

我如何在payspark ml中加载word2vec模型?

[我尝试从pyspark.ml.feature中加载以下行,以加载经过训练的word2vec模型。

回答 1 投票 0

使用Word2vec时,如何从看不见的单词语料库中得到结果?

我正在使用Word2vec模型提取相似的单词,但是我想知道在使用看不见的单词进行输入时是否有可能获得单词。例如,我有一个用语料库[melon,...

回答 1 投票 0

相对于各个实体的嵌入关系/边值生成上下文样本?

我正在尝试构建自己的语料库/文本数据集以训练特定于域的NER。我的实体主要基于数字,部分依赖于上下文进行分类。没有特定的数据集...

回答 1 投票 0

word2vec最佳库

嘿,我想在不实现它的情况下使用word2vec算法(我在很多地方都教过如何实现它)。有谁能告诉我最好使用什么库?我看到有Genesim,...

回答 2 投票 0

tensorflow 2.0中的word2vec实现

我想使用tensorflow 2.0实现word2vec,我已经根据跳过语法模型准备了数据集,并且得到了大约。 1800万个观测值(目标词和上下文词)。我用过...

回答 1 投票 0


int()的无效文字,以10为底:b'\ x1f \ x8b \ x08 \ x08 \ x80 \ xff \ xa8R \ x02 \ x03GoogleNews-vectors-negative300.bin \

我使用Python 3.6和Windows 10,请解决我遇到的问题,我是新手,请简要解释错误:数据已加载!句子数:2467 vocab大小:30417最大句子长度:2721 ...

回答 1 投票 0

如何学习word2vec模型[关闭]

我想使用word2vec,但是当我在下面输入代码时,出现错误。 KeyError:“单词'정부'不在词汇表中”我不知道该如何处理。你能帮助我吗?来自gensim.models.word2vec ...

回答 1 投票 0

Word2Vec比较来自具有不同大小的不同模型的向量

我已经使用gensim针对不同的语言训练了多个word2vec模型,但是每种模型的大小都不同。向量是这样获得的:vec_sp = word_vectors_sp.get_vector(“ uno”)...

回答 2 投票 3

Word2Vec模型的词汇量明显低于其基于的列表的词汇量?

model1 = Word2Vec(words_list_no_dupes,min_count = 0,size = 20,workers = 3,window = 3,sg = 1)print(model1)print(len(model1.wv.vocab))print(model.wv.vectors .shape)输出:Word2Vec(vocab = 58,size = 20,...

回答 1 投票 0

如何加载手套的单词矢量模型二进制文件(cooccurence.bin?

我正在使用GloVe nlp工具来计算两个单词的余弦距离:word1和word2。我已经训练好模型并通过运行以下命令获得了cooccurance.bin文件:./demo.sh我的问题是什么...

回答 1 投票 3

如何使用Word2vec生成自变量(X)?

我有一个电影评论数据集,其中有两列Review(Sentences)和Sentiment(1或0)。我想使用word2vec进行嵌入并使用CNN进行分类来创建分类模型。...

回答 1 投票 0

了解手套向量的用法

GloVe算法和word2vec都创建单词向量,每个单词一个向量。

回答 1 投票 0

使用棕色数据集(NLTK)的单词相似度的skip-gramm(word2vec)模型的准确性

我想基于NLTK库中的棕色数据集创建相似性矩阵。问题是损失tf.reduce_mean(tf.nn.sampled_softmax_loss(权重= softmax_weight,偏差= softmax_bias,...

回答 1 投票 0

为大量数据集加快Gensim的Word2vec的速度

我正在尝试使用Gensim在庞大的数据集上构建一个Word2vec(或FastText)模型,该数据集由1000个文件组成,每个文件包含〜210,000个句子,每个句子包含〜1000个单词。 ...

回答 1 投票 0

单词Vec带Spacy,将单词归为同一类别

我尝试将单词聚类到同一类别中。因此,我想使用Spacy Word2Vec。它已经可以使用诸如香蕉苹果和汽车之类的简单词了。它显示几乎相同的词。如果单词得到...

回答 2 投票 1

Gensim框架:保存和存储word2vec键控向量

我正在使用word2vec模型,在存储和读取模型时遇到问题。从gensim.models导入gensim.models.keyedvectors作为w2v导入KeyedVectors word_vectors = w2v.wv word_vectors ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.