word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

当应用word2vec时,仅显示字符而不显示单词?

这是我的代码,您可以看到我将句子与单词对齐,但是当我在句子中应用word2vec模型时,我仍然遇到问题,我使用阿拉伯文字anaconda版本4.7.12句子= nltk。...

回答 1 投票 0

如何在字典字典中将numpy数组添加为值?

假设我具有以下变量:从gensim.models导入gensim导入KeyedVectors wv = KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin',binary = True)dict_dict = {...

回答 1 投票 0

如何在pytorch中使用gensim来创建意图分类器(使用LSTM NN?)>

要解决的问题:给定一个句子,返回它的意图(想像聊天机器人)精简示例数据集(字典左侧的意图):data_raw = {“ mk_reservation”:[“我想做一个...] >

回答 2 投票 0

如何计算2个node2vec模型之间的距离

我有2个不同时间戳的node2vec模型。我想计算两个模型之间的距离。两个模型具有相同的词汇,我们将更新模型。我的模型就像这个模型1:“ 1”:0.1,...

回答 1 投票 0

将新操作添加到google colab上的tensorflow

我正在尝试在Google colab上编译一些.cc文件(如此处和此处所示),但是我找不到包含op.h的文件,而在编译时出现以下错误:word2vec_o ps.cc:16:10:致命错误:...

回答 1 投票 0

Word2Vec词汇相似之处

我在大约750k个单词的文本上运行了word2vec算法(在删除一些停用词之前)。使用我的模型,我开始查看与选择的特定单词最相似的单词,以及相似性...

回答 2 投票 0

MemoryError:在python中使用word2vec时无法分配形状和数据类型为float32的数组

我正在尝试从Wikipedia文本数据中训练word2vec模型,因为我正在使用以下代码。导入日志记录导入os.path导入sys导入gensim.corpora导入的多处理...

回答 1 投票 0

我们如何使用word2vec表示法实现单词义消歧?

我知道word2vec的工作原理,但是在寻找如何使用word2vec实现单词歧义消除时遇到了麻烦。您可以协助处理吗?

回答 1 投票 0

如何在自训练的word2vec模型中删除单词

我有一个自训练的word2vec模型(2G,以“ .model”结尾。我将模型转换为文本文件(超过50G,以“ .txt”结尾),因为我必须在其他python代码中使用文本文件。我正在尝试...

回答 1 投票 0

如何逐步训练word2vec模型

我有一个超过40G的数据集。由于内存有限,令牌生成器的程序被杀死,因此我尝试拆分数据集。如何逐步训练word2vec模型,即如何使用单独的...

回答 1 投票 0

如何通过CBOW(GenSim)从一组输入单词中查找最相似的单词?

我使用GenSim和CBOW训练语料库。如何从一组输入单词中获得最相似的单词?例如:给定一组输入词:[“ David”,“ Mary”,“ married”]。我可以推断出一些...

回答 1 投票 0

gensim中的分批训练word2vec在多名工人的支持下

上下文存在一些有关如何使用gensim和流数据训练Word2Vec的问题。无论如何,这些问题没有解决流式传输不能使用多个工作程序的问题,因为...

回答 1 投票 0

有没有办法了解word2vec的输出功能?

我想了解word2vec输出中每个维度的含义。例如,如果我用一个热编码变量创建决策树,则可以准确分辨出分类中的哪个类别...

回答 1 投票 1

word2vec中的类似单词是否有波兰语实现?

我找到了GoogleNews-vectors-negative300.bin库,但仅适用于ENG单词,在word2vec中是否有针对类似单词的波兰语实现?我已经尝试使用cc.pl.300.bin和NKJP -...

回答 1 投票 0

Word2Vec二次采样—实现

我正在Pytorch和Tensorflow2中实现Skipgram模型。我对常用字的二次采样的实施方式有疑问。从本文的逐字记录中,...

回答 1 投票 0

用于Word2Vec模型测试的问题对(基本事实)数据集?

我正在寻找测试数据集来优化我的Word2Vec模型。我从gensim找到了一个很好的例子:gensim / test / test_data / questions-words.txt有人知道其他类似的数据集吗?谢谢!

回答 1 投票 -2

如何释放pyspark模型(JavaModel)占用的内存?

如上所述,我通过pyspark加载了经过训练的word2vec模型。 word2vec_model = Word2VecModel.load(“保存路径”)使用完后,由于要在...

回答 1 投票 0

如何向Word2vec gensim手动添加单词和向量?

假设word2vec.model是我训练有素的word2vec模型。当出现词汇量不足的单词(oov_word)时,我使用compute_vec(oov_word)方法计算向量vec。现在,我想添加/附加oov_word ...

回答 1 投票 0


查找目标单词和中心word2vec矩阵

[我已经读过并听到(在斯坦福大学的CS224中),Word2Vec算法实际上训练了两个矩阵(即,两个向量集。)这两个是U和V集,一个是单词作为目标。 ..

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.