R: - 模型/变量长度不一致 - 随机森林

问题描述 投票:1回答:1

我正在尝试构建一个随机森林,但无论我如何努力处理NA并重新构建我的数据,我都会继续得到同样的错误,因为这似乎是导致此错误的最常见原因。但它仍然存在,我无法运行我的模型。

  ##Prepare data for random forest
Comprr<-Compr
Comprr$Mudster<-ifelse(Comprr$verifikation <10,'good','ok')
Comprr$Mudster[Comprr$verifikation==10]<-'restricted'
Comprr$Mudster<-as.factor(Comprr$Mudster)
table(Comprr$Mudster)

##Separate test and train data 
set.seed(123)
samp<-sample(nrow(Comprr),0.6 * nrow(Comprr))
train<-Comprr[samp, ]
test<-Comprr[-samp, ]
na.roughfix(Comprr)
##Building the model
library(randomForest)
model<-randomForest(Comprr$Mudster~ . -verifikation,data = train)

这是代码的相关部分,这是它返回的错误消息

Error in model.frame.default(formula = Mudster ~ . - verifikation, data = train,  : 
  variable lengths differ (found for 'message'

)这是不管变量我试图一次一个地清除它们,直到我意识到它更基本的东西。非常感谢您的帮助!提前致谢

r statistics random-forest
1个回答
0
投票

尝试在RF模型行之前运行此操作

姓名(Comprar)< - male.names(姓名(Comprar))

© www.soinside.com 2019 - 2024. All rights reserved.