我想建立一个随机森林回归模型我的数据。对于第一个参数我写式中,然后我所指定的数据,最后写所需的树的数目。
rf_model = randomForest(targetVar ~., data = train, ntree = 50)
执行这行代码时,我得到的错误是:
Error in terms.formula(formula, data = data) :
'.' in formula and no 'data' argument
是什么原因造成的错误?这是一个非常简单明了的实施随机森林回归模型。另外,阅读有关错误不会产生任何有效的解决方案。
这个问题是不是与randomForest
功能。这是与train
数据集,以及如何指导randomForest
来处理它。
randomForest()
如何处理NA
值。例如,你必须设置na.action=na.omit
。因此,作为一个例子,我会告诉你如何得到它具有2个变量工作。
train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales
该na.omit
并不是唯一可用的功能。请参阅更多的NA处理函数的文档。
你一定要看到你要使用哪些变量。希望这可以帮助。