机器学习:在另一个数据集上进行预测时,分类器准确性不佳

问题描述 投票:1回答:1

same question在这里,但是具有不同的上下文,这就是为什么无法实现的原因,因为他已经有两个相同的shapesize数据集。但就我而言,我正在调整Train Features的大小,以使其大小等于TEST Features。所有代码都运行良好,但是线性SVM,内核SVM,多项式NaiveBayes的相同问题性能小于“ 60%”。例如,<< [MultinomialNB为]的情况下的分类报告

    f1分数(准确性)= 0.58

  • f1得分(平均avg = 0.49)>
  • f1得分(加权平均)= 0.61
  • 我认为对[[processed_TRAIN_features
  • 进行整形后,我的新稀疏矩阵不好……是真的吗?在下面的代码中,我将列从

    9434增强为10782processed_TRAIN_features = csr_matrix((processed_TRAIN_features),shape=(98962,10782)) 是否正确?如果有任何问题,请告诉我。其余代码为here

    预先感谢

    这里是相同的问题,但是上下文不同,这就是为什么无法实现的原因,因为他已经有两个形状和大小相同的数据集。但就我而言,我正在调整“火车特征”的大小,因此...

    python machine-learning reshape shapes text-classification
    1个回答
    0
    投票

    深入研究数据-也许有一些泄漏的功能;

    © www.soinside.com 2019 - 2024. All rights reserved.