K-fold交叉验证和样本外交叉验证。

问题描述 投票:0回答:1

有什么区别?K-fold cross validationOut of sample cross validation? 能否用几句话描述一下每种CV方法的步骤?

machine-learning statistics data-science data-analysis cross-validation
1个回答
1
投票

K-fold交叉验证是样本外交叉验证的一种。"样本外 "这个名字来自于以下事实:如果我们拟合模型并计算训练集上的MSE,我们将得到一个乐观的偏差评估,即模型对独立数据集的拟合程度。这个有偏差的估计称为拟合的样本内估计(我们会使用训练样本),而交叉验证估计是样本外估计。

在k倍交叉验证中,原始样本被随机分割成k个大小相等的子样本。在k个子样本中,保留一个子样本作为测试模型的验证数据,其余k - 1个子样本作为训练数据。然后,交叉验证过程重复k次,k个子样本中的每个子样本正好作为验证数据使用一次。然后,可以将k个结果进行平均,得出一个单一的估计结果。与重复随机子抽样相比,这种方法的优点是所有的观测值都被用于训练和验证,而且每个观测值都正好用于验证一次。

对于其他方法,你可以查看维基百科,他们有很好的总结。https:/en.wikipedia.orgwikiCross-validation_(statistics)#Types

© www.soinside.com 2019 - 2024. All rights reserved.