如何让TF-IDF学习具有更高优先级的文档的一部分?

问题描述 投票:1回答:1

我使用sklearn的TfIdf。

我想学习文档之间的相似性。但是,这些文档包含的标题比文档的其他部分带来更多信息。

是否有可能告诉TF-IDF,例如,如果标题中出现一个单词,那么它应该比其他地方的同一个单词更重要吗?

谢谢

nlp tf-idf
1个回答
0
投票

不。但是你可以单独对你的标题进行TFIDF并对该向量/矩阵应用偏差计算,以便在将其加入到其他向量/矩阵之前对其进行增强。

© www.soinside.com 2019 - 2024. All rights reserved.