[我看过几篇文章和有关特征选择(包装器和嵌入式方法)的示例,其中将样本数据分为训练集和测试集。
我理解为什么我们需要使用交叉验证(将数据拆分为训练集和测试集)来构建和测试模型的得分(对提议算法的实际预测)。
但是我不明白选择特征的动机是什么?
我们需要选择哪些功能没有真正的结果,那么它如何改善功能选择的过程?
有什么好处?
而且,对于不同的特征组合,最佳超参数不一定相同。交叉验证有助于调整,因此可以进行更公平的比较。
This也是有关此主题的有用资源。