我正在研究mlr包,R。但是我能找到的所有教程都集中在每个函数的使用上。我希望我能找到一个全面的例子,包括建模的所有步骤。
假设有一个数据:
mydata <- data.frame(type=c('a','a','b','b','c','d','d','d','e','a',
'a','c','b','e','a','d','w','t','r','a',
'b','c','d','w','q','f','d','s','r','r'),
value=c(1,2,1,2,1,3,1,2,3,4,
5,6,2,4,2,6,7,8,5,3,
1,5,6,2,8,6,3,4,6,3),
target=c('y','y','n','n','n','n','n','n','n','n',
'n','n','n','n','n','n','n','n','n','y',
'n','n','n','n','n','n','n','n','y','n'))
你可以看到这是一个不平衡的数据。在目标字段中,只有4行由'y'表示,而所有其他26行都有'n'。对于分类问题,所有步骤应该是:
通常,这是如何构建模型的正常过程。现在,我只有创建虚拟值:
a <- mydata %>%
select(-target) %>%
createDummyFeatures(method = '1-of-n') %>%
mutate(target=mydata$target)
我不知道如何使用mlr建立一个完整的模型。有谁可以帮我提供所有细节?