我有一个数据帧(宏)由一个因变量(y)和19个独立变量或特征(x)组成。我想使用随机森林算法使用同一时期的x值预测最新的y变量(以蓝色突出显示)。
Macro <- read.csv("Input.csv")
x <- Macro[1:13,3:21] #training data
y <- Macro[1:13,2:2] #dependent variable
t <- Macro[14:14,2:21] #period I'd like to predict
rf <- randomForest(x,
y,
ntree=500,
importance=T)
predict(rf ,t)
上面返回一个值,但我非常强烈地意识到我正在接近随机森林并且没有真正使用正确的过程或代码。谢谢您的帮助。
这应该工作:
宏< - read.csv(“Input.csv”)
x < - Macro [1:13,3:21] #training数据
y < - Macro [1:13,2] #dependent variable
t < - Macro [14,3:21] #period我想预测
rf < - randomForest(x,y,ntree = 500,importance = T)
预测(rf,t)