gensim 相关问题

Gensim是一个免费的Python框架,旨在自动从文档中提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。

gensim-fasttext-为什么`load_facebook_vectors`不起作用?

我已经尝试从fastext-Wiki单词向量中加载经过预训练的FastText向量。我的代码在下面,并且运行良好。从gensim.models导入FastText模型= FastText.load_fasttext_format('。/ ...

回答 1 投票 0

为什么Gensim Doc2vec对象返回空doctag?

我的问题是我应该如何解释我的情况?我按照本教程https://blog.griddynamics.com/customer2vec-representation-learning-and-automl-for-customer -...

回答 1 投票 1

Gensim以txt格式保存单词向量错误

我的问题如下。我有一些以txt格式保存的预训练向量,我将它们加载到dict中。但是当我在gensim中再次训练它们后尝试保存它们时,给了我一个错误,例如...

回答 1 投票 0

导入gensim并收到TypeError:预期的字节,找到描述符

我尝试在python3中导入gensim库。所有的库都是最新版本。在第一次导入中遇到TypeError:期望的字节,找到了描述符,在第二次导入中得到了此错误:import ...

回答 1 投票 0

汇总熊猫数据框列

我有一个大数据框(约470万行),其中一列包含文档文本。我尝试在整个数据帧的特定列上运行Gensim摘要失败。 df ['summary'] = ...

回答 1 投票 1

Gensim v3.6.0 Word2Vec DeprecationWarning:调用不推荐使用的`wv`(属性将在4.0.0中删除,改为使用self)

我正在使用Gensim 3.6.0加载预训练的Word2Vec,并且在调用model.wv时显示以下错误。 /anaconda/envs/python36/lib/python3.6/site-packages/ipykernel_launcher.py:1:...

回答 1 投票 0

无法使用gensim加载Doc2vec对象

我正在尝试使用gensim加载预先训练的Doc2vec模型,并使用它将段落映射到向量。我指的是https://github.com/jhlau/doc2vec,我下载的预训练模型是...

回答 1 投票 1

Gensim Word2Vec模型浮点数

我已经使用gensim训练了word2vec模型。在模型矩阵中,某些值的浮点如下所示:“ -7.18556e-05”我需要将矩阵上的值用作字符串。有没有办法...

回答 1 投票 0

Glove6b50d解析:无法将字符串转换为浮点:'-'

我正在尝试通过Google Colab解析来自Kaggle的Glove6b50d数据,然后通过word2vec流程运行(对巨大的URL表示歉意,这是我找到的最快的链接)。但是,我在打...

回答 1 投票 0

Python Gensim FastText保存和加载模型

我正在使用Gensim FASTText建模,并且存在以下问题。 “ ft_model.save(BASE_PATH + MODEL_PATH + fname)”的输出将保存以下3个文件。它是否正确?有没有办法...

回答 1 投票 0

如何在三个预训练模型之间比较余弦相似度?

我有两个语料库-一个包含所有女性领导讲话,另一个包含男性领导讲话。我想检验一个语料库中两个单词之间的余弦相似度为...

回答 1 投票 0

如何解决fastfast-model300的下载问题?

我正在使用Windows 10和python 3.3。我尝试下载fasttext_model300来计算文档之间的软余弦相似度,但是当我运行python文件时,到达此位置后它就停止了...

回答 1 投票 0

将gensim LDA模型保存到s3

我已经通过使用gensim获得了LDA模型。我可以在本地保存它:ldamodel.save('models / lda / lda.model')这将在指定位置生成四个文件:lda.model lda.model.expElogbeta.npy lda ....

回答 1 投票 0

根据Gensim模型计算余弦相似度

我正在尝试通过Gensim LDA主题模型计算主题间的余弦相似度得分,但这比我最初预期的要复杂。 Gensim有一种计算距离的方法...

回答 1 投票 0

在Google Colab上保存gensim doc2vec训练的模型

我正在使用gensim doc2vec模型在Google colab存储库GPU运行时上训练文本数据,并希望将经过训练的模型保存在test.d2v文件中。以下是代码段T = [...的TaggedDocument(doc,[i]]]]

回答 1 投票 0

Word2Vec使用字符代替单词

我已经标记了我的字符串,并用它们做成了Pandas列,如果我打印df ['word_splits']列,它看起来像这样。 0 ['解释','为什么','该','编辑','制造',... 1 [“ d'aww”,'...

回答 1 投票 0

word2vec,使用文档正文或关键字作为训练语料库

我想使用每个文档的关键字和类别的无序列表来训练word2vec模型。因此,我的词汇量大约为2.5k令牌。会不会表现...

回答 2 投票 0

如何提取与示例句子列表相比具有相似含义/意图的句子

我在客户和顾问之间进行了聊天互动[对话],想知道顾问互动是否包含以下列表中的特定句子或类似句子:示例...

回答 1 投票 1

GenSims FastText实施中的监督培训和测试

我目前正在使用Gensim的无监督训练方法来训练来自某个领域的文档的Gensim FastText模型。训练完单词表示后,我希望...

回答 1 投票 0

KeyError:单词fransız不在词汇表中

[当我尝试运行以下代码时,出现键盘错误:KeyError:单词fransız不在词汇表中。有什么问题从gensim.models导入numpy作为np导入从nltk.tokenize导入Word2Vec导入...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.