R:如何使用rpart中的子集选项?

问题描述 投票:0回答:1

从文档中的 help(rpart),有一个 subset 选项,它是一个 "可选的表达式,表示在拟合中只应使用数据的行的子集"。

我到底该如何去使用这个选项呢?

library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
             data = kyphosis,
             subset = sample(1:nrow(kyphosis), 20))

在上面的代码中,我随机抽取了20个行索引,从 kyphosis 数据。这样的用法正确吗?

r decision-tree rpart
1个回答
0
投票

是的,这个是可以的。用 subset,你也可以。

  • 明确地选择行,你的 data.frame: subset=1:21
  • 根据变量值选择行。subset=(Age<50)
© www.soinside.com 2019 - 2024. All rights reserved.