种子在随机森林中起什么作用?

问题描述 投票:0回答:1

我知道通常使用种子设置,以便我们可以重现相同的结果。但是,在随机森林部分中设置种子实际上是做什么的。它是否会改变 R 中

randomForest()
函数的任何参数,例如
nTree
sampSize

我每次都为随机森林模型使用不同的种子,但想知道不同的种子如何影响随机森林模型。

r machine-learning random-forest random-seed
1个回答
5
投票

树木是从种子中长出来的,森林也是如此。

构建随机森林的方法有多种,但共同点是构建多棵树。为了提高单个决策树的分类准确性,随机森林中的各个树需要有所不同,因为同一棵树将有

nTree
倍。这种差异是通过在树的生成中引入随机性来实现的。随机性受到种子的影响,关于种子最重要的是使用相同的种子应该始终生成相同的结果。

随机性如何影响树的构建?有多种方法。

  • 为随机子集构建树。这是为森林中的每棵树绘制训练示例的子集,然后为该子集构建一棵树
  • 在树中的每个决策点,决策属性是随机选择的。

通常这两个元素是结合在一起的。

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1

© www.soinside.com 2019 - 2024. All rights reserved.