我知道通常使用种子设置,以便我们可以重现相同的结果。但是,在随机森林部分中设置种子实际上是做什么的。它是否会改变 R 中
randomForest()
函数的任何参数,例如 nTree
或 sampSize
。
我每次都为随机森林模型使用不同的种子,但想知道不同的种子如何影响随机森林模型。
树木是从种子中长出来的,森林也是如此。
构建随机森林的方法有多种,但共同点是构建多棵树。为了提高单个决策树的分类准确性,随机森林中的各个树需要有所不同,因为同一棵树将有
nTree
倍。这种差异是通过在树的生成中引入随机性来实现的。随机性受到种子的影响,关于种子最重要的是使用相同的种子应该始终生成相同的结果。
随机性如何影响树的构建?有多种方法。
通常这两个元素是结合在一起的。
http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1