我在哪里可以找到在R中使用mlr包的完整示例

问题描述 投票:0回答:1

我正在研究mlr包,R。但是我能找到的所有教程都集中在每个函数的使用上。我希望我能找到一个全面的例子,包括建模的所有步骤。

假设有一个数据:

mydata <- data.frame(type=c('a','a','b','b','c','d','d','d','e','a',
                            'a','c','b','e','a','d','w','t','r','a',
                            'b','c','d','w','q','f','d','s','r','r'),
                     value=c(1,2,1,2,1,3,1,2,3,4,
                             5,6,2,4,2,6,7,8,5,3,
                             1,5,6,2,8,6,3,4,6,3),
                     target=c('y','y','n','n','n','n','n','n','n','n',
                              'n','n','n','n','n','n','n','n','n','y',
                              'n','n','n','n','n','n','n','n','y','n'))

你可以看到这是一个不平衡的数据。在目标字段中,只有4行由'y'表示,而所有其他26行都有'n'。对于分类问题,所有步骤应该是:

  1. 将字段'type'转换为虚拟值
  2. 将数据分为两部分:培训和测试
  3. 对数据进行过采样,使得目标为“y”的数据量与目标为“n”的数据量相似。
  4. 分别为随机森林和xgboost设置超参数集。
  5. 使用交叉验证训练两个模型,假设k fold为5。
  6. 比较所有结果以选择最佳模型和最佳参数。
  7. 可视化结果。

通常,这是如何构建模型的正常过程。现在,我只有创建虚拟值:

a <- mydata %>%
  select(-target) %>%
  createDummyFeatures(method = '1-of-n') %>%   
  mutate(target=mydata$target) 

我不知道如何使用mlr建立一个完整的模型。有谁可以帮我提供所有细节?

r classification visualization cross-validation mlr
1个回答
1
投票

在这里你可以找到一个回归用例:https://mlr.mlr-org.com/articles/tutorial/usecase_regression.html

© www.soinside.com 2019 - 2024. All rights reserved.