我有一个句子列表,并用TfidfVectorizer
将它们向量化了>
sentences = ['this is really good', 'i am loving this food'] tfidf = TfidfVectorizer() vals = tfidf.fit_transform(sentences) print(pd.DataFrame(vals.A, columns=tfidf.vocabulary_)) this is really good am loving food 0 0.000000 0.000000 0.534046 0.534046 0.000000 0.534046 0.379978 1 0.534046 0.534046 0.000000 0.000000 0.534046 0.000000 0.379978
所以这是一个tfidf矩阵,所以我正在寻找的是IDF矩阵。当我尝试访问
tfidf.idf_
方法时,它只是返回了一个IDF值列表,但我需要的是上面的矩阵,但是要代替tfidf值,我需要IDF值。有没有办法做到这一点?
有人可以帮我吗?非常感谢您的帮助。
[我有一个句子列表,并用TfidfVectorizer句子将它们矢量化= ['这真的很好,'我很喜欢这种食物'] tfidf = TfidfVectorizer()vals = tfidf.fit_transform(...
“ IDF矩阵”实际上没有任何意义。只能为语料库中的所有文档