当我尝试为随机森林模型生成混淆矩阵时,出现以下错误: !all.equal(nrow(data), ncol(data)) 中的错误:参数类型无效
这是我使用的代码:
`ind <- sample(2, nrow(completeData), replace = TRUE, prob = c(0.7, 0.3))
trainData <- completeData[ind == 1, ]
testData <- completeData[ind == 2, ]
rf1 <- randomForest(price~., data = trainData)
print(rf1)
#Random Forest Model
p1 <- predict(rf1, newdata = testData)
testData$p1 <- p1
#Confusion matrix
confusionMatrix(table(testData$price, testData$p1))`
price
,因此,p1
可能是连续数据,而confusionMatrix
适用于分类数据(factor
)。
您可以
cut
将连续数据分类并像这样运行confusionMatrix
(根据实际价格范围调整休息时间):
confusionMatrix(table(cut(testData$price, breaks = 0:10),
cut(testData$p1, breaks = 0:10)
)
)
...但是为什么要降级连续数据而不是在连续级别上进行检查(散点图、相关性等)?