用于特征选择预处理的交叉验证的动机是什么？

问题描述投票：0回答：1

[我看过几篇文章和有关特征选择（包装器和嵌入式方法）的示例，其中将样本数据分为训练集和测试集。

我理解为什么我们需要使用交叉验证（将数据拆分为训练集和测试集）来构建和测试模型的得分（对提议算法的实际预测）。

但是我不明白选择特征的动机是什么？

我们需要选择哪些功能没有真正的结果，那么它如何改善功能选择的过程？

有什么好处？

machine-learning cross-validation feature-selection

1个回答

0
投票

交叉验证为使用不同特征子集的性能提供了一种比较健壮的方法，因此，提供了一种更加健壮的特征选择过程。例如，如果使用K折交叉验证，则比较将基于来自不同数据折的误差的平均值，因此，选择的子集将导致最小的泛化误差。

而且，对于不同的特征组合，最佳超参数不一定相同。交叉验证有助于调整，因此可以进行更公平的比较。

This也是有关此主题的有用资源。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.