我使用sklearn的TfIdf。
sklearn
我想学习文档之间的相似性。但是,这些文档包含的标题比文档的其他部分带来更多信息。
是否有可能告诉TF-IDF,例如,如果标题中出现一个单词,那么它应该比其他地方的同一个单词更重要吗?
谢谢
不。但是你可以单独对你的标题进行TFIDF并对该向量/矩阵应用偏差计算,以便在将其加入到其他向量/矩阵之前对其进行增强。