我知道tfidf vectorizer的公式是
tfidf vectorizer
Count of word/Total count * log(Number of documents / no.of documents where word is present)
我看到scikit中有tfidf变换器学习,我只是想区分它们。我找不到任何有用的东西。
TfidfVectorizer用于句子,而TfidfTransformer用于现有的计数矩阵,例如CountVectorizer返回的计数矩阵