model.getVectors()。keys()是否会返回模型中的所有键

问题描述 投票:0回答:1

下面是一个示例代码。我正在尝试获取newfile.txt中所有单词的向量表示(文件有新闻文章)。想知道model.getVectors()。keys()是否输出所有键(文件中的不同单词)或是否将输出限制为特定数字。

虽然我的输入有很多,但目前我只得到几个字作为关键字。它是如何工作的?

doc = sc.textFile('newfile.txt').map(lambda line: line.split(" "))

model = Word2Vec().fit(doc)

model.getVectors().keys()
pyspark apache-spark-mllib word2vec
1个回答
0
投票

我找到了答案,所有的键(单词)都没有列出因为这个参数给模型setMinCount(),默认值为5

来自documentation

谢谢您的帮助 !

© www.soinside.com 2019 - 2024. All rights reserved.