从scikit learn的余弦相似度中获取top x最相似的样本

问题描述 投票:0回答:0

有没有办法让

cosine_similarity
功能变小?我有大约 60MB 的词向量稀疏矩阵,cosine_similarity 的 ndarray 非常大。我如何才能获得每个最相似的前 100 样本?

我有这么多数据的 RAM 问题,我的应用程序在计算过程中崩溃了。

numpy scikit-learn scipy nlp sparse-matrix
© www.soinside.com 2019 - 2024. All rights reserved.