补全朴素基数会降低测试集的准确性吗？

问题描述投票：0回答：1

我在我的70000尺寸和平衡训练集上应用了sckit学习ComplementNB模型，以执行20个分类任务。这是一个文档分类任务。

我现在面临的问题是，验证集的准确性约为62％，但是，当我应用模型并将其引导到30000大小的测试集上时，结果仅为56％。什么原因会导致准确性下降？

我首先将数据另存为tfidf稀疏矩阵。然后申请用f_classif选择Kbest以减小尺寸

machine-learning scikit-learn classification naivebayes

1个回答

0
投票

[我坚信这可能是由于数据库中的差异所致。就像将相似的功能映射到不同的标签一样，因此请尝试编辑预处理数据的方式

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.