gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

如何修复python中的“相对导入错误”(gensim.summarization)

我正在运行此代码来自gensim.summarization import summarize text =“1945年夏末,客人们聚集在一起参加Don Vito Corleones的婚宴”+“女儿康妮(Talia ...

回答 2 投票 0

如何最佳地处理不在word2vec词汇中的单词

我有一个大约1000万个句子的列表,其中每个句子最多包含70个单词。我在每个单词上运行gensim word2vec,然后对每个单词进行简单的平均。问题是......

回答 2 投票 3

Doc2Vec:获取标签的文字

我已经训练过Doc2Vec模型我正试图获得预测。我使用test_data = word_tokenize(“ФилипМоррисПродактсС.А。”。lower())model = Doc2Vec.load(model_path)v1 = model.infer_vector(test_data)...

回答 1 投票 1

Doc2Vec:使用model.docvecs.most_similar的奇怪结果

我尝试训练模型以获得句子相似性(在我的情况下,某些组织的名称)我用来训练模型names_tok = [TaggedDocument(words = word_tokenize(name.lower()),tags = [str(i)]).. 。

回答 1 投票 0

TypeError:序列项0:期望找到类似字节的对象,str

我试图从Python 3中使用word2vec-gensim的文本文件中的wiki标题转储中提取印度尼西亚标题.Wiki转储包含其他语言的标题和一些符号。下面......

回答 1 投票 0

在调用gensim时出现异常?

我试图在我的代码中加载gensim。通常它工作正常。今天,我得到以下异常:Traceback(最近一次调用最后一次):文件“/project/6008168/tamouze/just.py”,第2行,in ...

回答 1 投票 0

如何将numpy数组加载到gensim Keyedvector格式?

在我训练了单词嵌入后,我将其保存为npz格式。当我尝试将其加载为KeyedVectors格式时,它会产生错误。如何将numpy数组加载为gensim.KeyedVectors格式?我真的需要 ...

回答 1 投票 0

gensim word2vec:查找词汇表中的单词数量

在使用python gensim训练word2vec模型后,你如何找到模型词汇中的单词数量?

回答 2 投票 23

gensim word2vec打印日志丢失

当使用gensim word2vec模型时,如何打印记录(文件或粗壮)训练阶段每个时期的丢失。我试过:logging.basicConfig(format ='%(asctime)s:%(levelname)s:%(message)s')...

回答 1 投票 1

如何在Gensim中获取上下文单词列表

如何从预训练的快速文本模型中获取最常用的上下文单词?例如:对于单词'football'和语料库[“我喜欢和我的朋友一起踢足球”]获取上下文单词列表:['playing','...

回答 1 投票 1

Gensim LDA提供主题ID但概率的输出不等于1

我已经将LDA模型训练到了100个集群主题,根据我的知识,每个主题都应该以一定的概率输出,所有这些都加起来1.但是当我运行这个代码时,我得到......

回答 1 投票 0

python gensim:AttributeError:'list'对象没有属性

我有一个小的python管道。一节课清理数据并将其解释。它返回一个字符串列表列表(即List [List [str]])。然后我将列表传递给另一个传递数据的类......

回答 1 投票 0

每次运行时,Google新闻Word2Vec型号都会占用存储空间吗?

这似乎是一个奇怪的问题,但我是新来的,所以我想不管怎样。我想在我的笔记本电脑上使用这个Google新闻模型来处理各种不同的文件。这意味着我将运行这个......

回答 1 投票 0

Word2Vec词汇仅产生字母和符号

我是Word2Vec的新手,我正在尝试根据它们的相似性来聚类。首先,我使用nltk分隔句子,然后使用结果列表作为输入...

回答 1 投票 1

Python 3.6:ImportError:尝试导入gensim时无法导入名称'config'

我正在运行最新版本的Python:'3.6.5 | Anaconda custom(64-bit)| (默认,2018年3月29日,13:14:23)\ n [GCC 4.2.1兼容Clang 4.0.1(标签/ RELEASE_401 / final)]'尝试导入时......

回答 1 投票 1

Word2Vec时间复杂度

我已经google了这个问题,但我找不到任何可靠的解决方案(有些来源给log(V)一些日志(V / 2)。但是word2vec模型的时间复杂度是多少,具有以下参数:...

回答 1 投票 0

Doc2Vec和PySpark:关于DeepDist的Gensim Doc2vec

我正在研究DeepDist(链接)模块,并考虑将其与Gensim的Doc2Vec API结合起来训练PySpark上的段落向量。该链接实际上提供了以下干净的示例...

回答 1 投票 11

为什么FastText字嵌入可以生成另一种语言的单词表示?

最近,我训练了一个来自sentiment140的FastText字嵌入来获得英语单词的表示。但是,今天只是为了试用,我用几个中文单词运行FastText模块,......

回答 1 投票 0

使用Gensim训练Word2vec模型

这是我的code.it从excel文件(rev列)读取评论并列出列表。 xp就像这样[“['无畏','笨拙','二重奏','交付','好','一'',['更好','提供','......

回答 1 投票 0

短语的快速文本表示,但不包含包含短短语的较长短语

我正在使用Gensim从Fasttext加载德语.bin文件,以获得词汇表外单词和短语的向量表示。到目前为止它工作正常,我总体上取得了良好的效果....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.