sklearn linear_kernel产生余弦相似度-内存错误

问题描述 投票:0回答:1

由于数据量太大,我一直在使用sklearn TfidfVectorizer查找余弦相似度,我一直在遇到内存错误

tf = TfidfVectorizer(analyzer='word', ngram_range=(1, 3),max_df=1.0, min_df=0, stop_words='english')
tfidf_matrix = tf.fit_transform(ds['description'])

> cosine_similarities = linear_kernel(tfidf_matrix, tfidf_matrix) <-- Memory Error

请帮助我解决该错误。非常感谢

machine-learning scikit-learn cosine-similarity tfidfvectorizer
1个回答
0
投票

如果出现意外的MemoryError,并且您认为应该有足够的可用RAM,可能是因为您使用的是32位python安装。

© www.soinside.com 2019 - 2024. All rights reserved.