doc2vec 相关问题

Doc2Vec是一种无监督算法,用于转换向量中的文档(“密集嵌入”)。它基于“Paragraph Vector”论文,并在Gensim Python库和其他地方实现。该算法可以在“Distributed Bag Of Words”模式下工作(PV-DBOW,其工作方式与Word2Vec中的skip-gram模式类似)或“分布式存储器”模式(PV-DM,更类似于CBOW模式)在Word2Vec。)

Doc2vec:gensim doc2vec模型中只有10个docvecs?

我使用gensim拟合doc2vec模型,标记文档(长度> 10)作为训练数据。目标是获取所有训练文档的doc向量,但在model.docvecs中只能找到10个向量。 ......

回答 1 投票 4

生产环境中的文档相似性

我们有n个文件。在用户提交新文档后,我们的目标是告知他可能的现有文档重复(就像stackoverflow建议的问题可能......

回答 1 投票 2

在基于经文主题的神圣古兰经经文检索系统构建我的doc2vec嵌入模型时需要帮助

我的毕业设计项目中有一个重要的模块,它即将学习一个模型,帮助我给它一个输入/查询,预期是一个“伊斯兰”主题,模型的输出是一些......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.