怎么修 ”'。'在式和无“数据”参数”使用随机森林功能时?

问题描述 投票:1回答:1

我想建立一个随机森林回归模型我的数据。对于第一个参数我写式中,然后我所指定的数据,最后写所需的树的数目。

rf_model = randomForest(targetVar ~., data = train, ntree = 50)

执行这行代码时,我得到的错误是:

Error in terms.formula(formula, data = data) : 
'.' in formula and no 'data' argument

是什么原因造成的错误?这是一个非常简单明了的实施随机森林回归模型。另外,阅读有关错误不会产生任何有效的解决方案。

r random-forest
1个回答
0
投票

这个问题是不是与randomForest功能。这是与train数据集,以及如何指导randomForest来处理它。

  1. 你必须指示randomForest()如何处理NA值。例如,你必须设置na.action=na.omit
  2. 您的数据集有太多的变数 - 随机森林抱怨53个变数实在是太多了。

因此,作为一个例子,我会告诉你如何得到它具有2个变量工作。

train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales

na.omit并不是唯一可用的功能。请参阅更多的NA处理函数的文档。

你一定要看到你要使用哪些变量。希望这可以帮助。

© www.soinside.com 2019 - 2024. All rights reserved.