我把我的SVM模型在二元类上预测的分类报告打印出来了,但是第一次预测就得了高分(95%以上),打印出高分值我就知道是好的,但是之后需要进行特征选择,您觉得这正常吗?还有什么样的特征选择适合二元分类呢?
你认为这是正常的吗?
这取决于你的数据。如果你的数据是完全可以线性分离的,那么几乎所有的线性分类器都会表现良好。
如果所有的精度、召回率和F评分都很高,而且对你来说足够高,那么可能你就不用再进一步了。
你可以看到特征的重要性,那么你可以阅读这篇文章。确定sklearn中对SVM分类器贡献最大的特征。
而如果你使用另一种算法,特征的重要性也许会有一点不同。