补全朴素基数会降低测试集的准确性吗?

问题描述 投票:0回答:1

我在我的70000尺寸和平衡训练集上应用了sckit学习ComplementNB模型,以执行20个分类任务。这是一个文档分类任务。

我现在面临的问题是,验证集的准确性约为62%,但是,当我应用模型并将其引导到30000大小的测试集上时,结果仅为56%。什么原因会导致准确性下降?

我首先将数据另存为tfidf稀疏矩阵。然后申请用f_classif选择Kbest以减小尺寸

machine-learning scikit-learn classification naivebayes
1个回答
0
投票

[我坚信这可能是由于数据库中的差异所致。就像将相似的功能映射到不同的标签一样,因此请尝试编辑预处理数据的方式

© www.soinside.com 2019 - 2024. All rights reserved.