从文档中的 help(rpart)
,有一个 subset
选项,它是一个 "可选的表达式,表示在拟合中只应使用数据的行的子集"。
我到底该如何去使用这个选项呢?
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
data = kyphosis,
subset = sample(1:nrow(kyphosis), 20))
在上面的代码中,我随机抽取了20个行索引,从 kyphosis
数据。这样的用法正确吗?
是的,这个是可以的。用 subset
,你也可以。
data.frame
: subset=1:21
subset=(Age<50)