机器学习：在另一个数据集上进行预测时，分类器准确性不佳

问题描述投票：1回答：1

same question在这里，但是具有不同的上下文，这就是为什么无法实现的原因，因为他已经有两个相同的shape和size数据集。但就我而言，我正在调整Train Features的大小，以使其大小等于TEST Features。所有代码都运行良好，但是线性SVM，内核SVM，多项式NaiveBayes的相同问题性能小于“ 60％”。例如，<< [MultinomialNB为]的情况下的分类报告

f1分数（准确性）= 0.58

f1得分（平均avg = 0.49）>

f1得分（加权平均）= 0.61

我认为对[[processed_TRAIN_features

进行整形后，我的新稀疏矩阵不好……是真的吗？在下面的代码中，我将列从

9434增强为10782processed_TRAIN_features = csr_matrix((processed_TRAIN_features),shape=(98962,10782))是否正确？如果有任何问题，请告诉我。其余代码为here

预先感谢

这里是相同的问题，但是上下文不同，这就是为什么无法实现的原因，因为他已经有两个形状和大小相同的数据集。但就我而言，我正在调整“火车特征”的大小，因此...

python

machine-learning

reshape

shapes

text-classification

1个回答

0
投票

深入研究数据-也许有一些泄漏的功能；

机器学习：在另一个数据集上进行预测时，分类器准确性不佳

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1