H2O手册中介绍了k-fold交叉验证的数据是如何分割的。给出的例子是5折交叉验证的例子。
请看这里。http:/docs.h2o.aih2olatest-stableh2o-docsdata-sciencealgo-paramsnfolds.html。 其中指出
"前5个模型(交叉验证模型)是建立在80%的训练数据上的,5个模型中的每个模型都有不同的20%。"
如果选择不同的折线值,这些百分比会不会不同例如,假设选择10作为折线数,下面的说法是否正确?
'前10个模型(交叉验证模型)是在90%的训练数据上建立的,10个模型中每个模型都会抱出不同的10%。
是的,你说的没错。 用于训练的数据的百分比由折数决定。