我应该先执行交叉验证,然后再进行网格搜索吗?

问题描述 投票:2回答:2

我是机器学习领域的新手。我的问题如下:我已经建立了一个模型,并且正在尝试优化这种模型。通过做一些研究,我发现交叉验证可以用来帮助我避免模型过度拟合。此外,Gridsearchcv可用于帮助我优化此类模型的参数并最终确定最佳的参数。

现在我的问题是,我应该先进行交叉验证,然后使用网格搜索来确定最佳参数,或者使用GridsearchCV本身就可以执行交叉验证,就足够了吗?

machine-learning scikit-learn cross-validation grid-search
2个回答
0
投票

现在我的问题是,我应该先进行交叉验证,然后使用网格搜索来确定最佳参数,或者使用GridsearchCV本身就可以执行交叉验证,就足够了吗?

第二个。 GridSearchCV使用交叉验证拆分策略来选择最佳参数。如果您阅读scikit-learn documentation,则有一个名为“ cv”的参数,默认情况下它定义了5倍交叉验证。如果您需要使用其他交叉验证策略,则可以为其提供int,交叉验证生成器或可迭代的


0
投票

请参见Cross validation with test data set

我的建议,如果您的数据集足够大:

  1. 将数据集拆分为训练和测试子集。
  2. 对您的训练数据集执行GridSearchCV
  3. 根据测试子集评估最佳模型(来自GridSearchCV)。>>
© www.soinside.com 2019 - 2024. All rights reserved.