word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

无法使用gensim加载Doc2vec对象

我正在尝试使用gensim加载预先训练的Doc2vec模型,并使用它将段落映射到向量。我指的是https://github.com/jhlau/doc2vec,我下载的预训练模型是...

回答 1 投票 1

如何使用neo4j用单词向量创建词汇图?

我想用词向量创建词汇表。目的是基于单词相似度在词汇表中查询最近的单词。我们如何在neo4j上实现这一目标?以下是一个...

回答 1 投票 0

如何仅从word2vec类似单词列表中获取文本元素? python

我有这段代码,我要搜索的结果是一个数组,其中只有最相似列表中的单词。 model1.most_similar('Mercedes-Benz SLK-Class')[:5] [('BMW M4',0.9959905743598938),('...

回答 1 投票 0

手套文本预处理

我注意到技术上,人们将文本URL,数字和日期转换为。手套数据集是否已针对这些占位符进行过嵌入训练。我可以直接将它们输入数据集中吗?

回答 1 投票 0

如何在三个预训练模型之间比较余弦相似度?

我有两个语料库-一个包含所有女性领导讲话,另一个包含男性领导讲话。我想检验一个语料库中两个单词之间的余弦相似度为...

回答 1 投票 0

如何在python文件中设置PYTHONHASHSEED

我正在尝试在python文件中设置PYTHONHASHSEED = 0,而我的python版本是3.6。我正在使用Word2Vec模型“(Word2Vec(description,min_count = 1,size = 100,worker = 3,window = 3,sg = 1,seed = 0))”,我...

回答 1 投票 0

我如何将组词应用于自己的文本语料库?

我最近遇到了本文(https://arxiv.org/pdf/1605.09096.pdf),并且我一直在阅读GitHub(https://github.com/williamleif/histwords),但事实并非如此对我清楚...

回答 1 投票 1

单词向量的中心

我正在研究NLP,并把头放在穿过多层感知器的步骤中。由于向量是空间中的大小和方向,所以我很好奇单词向量的中心是什么...

回答 1 投票 0

word2vec,使用文档正文或关键字作为训练语料库

我想使用每个文档的关键字和类别的无序列表来训练word2vec模型。因此,我的词汇量大约为2.5k令牌。会不会表现...

回答 2 投票 0

KeyError:单词fransız不在词汇表中

[当我尝试运行以下代码时,出现键盘错误:KeyError:单词fransız不在词汇表中。有什么问题从gensim.models导入numpy作为np导入从nltk.tokenize导入Word2Vec导入...

回答 1 投票 0

GoogleNews-vectors-negative300.bin的词汇中没有单词

[我试图查看哪种经过预训练的模型在新闻中包含常用短语,我认为GoogleNews-vectors-negative300.bin应该是一个全面的模型,但事实证明,它甚至都没有...

回答 2 投票 0

如何在gensim中的word2vec模型中嵌入用户名

[我有一些志愿者论文,其格式为:志愿者名称,论文[“ emi”,“ jenne”,“ john”],[[“ let”,“ protect”,“ nature”],[“ what”, “是”,“自然”],[“自然”,“人类”,“地球”]] [“ ...

回答 1 投票 0

Gensim word2vec模型是否与Mikolov的标准模型相同?

我正在执行一篇论文以比较我们的表现。在这篇论文中,uathor说了300维预训练的word2vec向量(Mikolov等人,2013),我想知道预训练的... 2>

回答 1 投票 0

如何在基于无监督方面的情感分析中进行主题检测

我想使用Python制作ABSA,并从在线评论中分析预定义方面(例如交付,质量,服务)的情绪。我想在无人监督的情况下执行此操作,因为这可以节省我的时间...

回答 1 投票 0

电子邮件分类中有word2vec和KMeans的问题(无论买方还是非买方)

该数据集包含大约1万封电子邮件文本。想法是将它们分为买方或非买方类别。买方电子邮件中的某些标准字词遵循以下模式:请求报价...

回答 1 投票 -1

如何使用第一个手套的溶液初始化第二个手套模型?

我正在尝试实现有关如何在text2vec中对齐两个GloVe模型的问题的解决方案之一。我不了解在GlobalVectors $ new(...,init = ...

回答 1 投票 2

spaCy如何为短语生成向量?

spaCy的中,大型词汇可以生成单词和短语的向量。让我们考虑以下示例:import spacy nlp = spacy.load(“ en_core_web_md”)令牌= nlp(“ apple cat sky”)...

回答 1 投票 0

TypeError:不可散列的类型:训练word2vec中的'list'

我编写了此函数,并得到TypeError:不可哈希类型:'list'。我该如何解决? def get_words(txt):a =(lambda x:x不在STOP_WORDS中),re.findall(r'\ b(\ w +)\ b',txt)返回def ...

回答 1 投票 0

在平均Word2Vec crerated向量上出现错误

我想使用gensim在我的tweet数据集上创建Word2Vec矢量。该代码用于基于推文的多标签情感分类。我已经汇总了包含107k条推文的推文文件。 i ...

回答 1 投票 0

第一次使用Word2Vec,尝试根据用户的技能对他们进行群集

对于我的论文,我必须分析应聘者的技能。我必须聚集用户并比较他们的技能。信息被分类,所以我建立了一个随机数据库,具有相同的...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.