我正在尝试计算二进制(0,1)与决策树预测的目标变量的ROC。
当我将预测值设置为二进制时,它给我以下错误:
> roc(as.numeric(pred),as.numeric(data$target))
Setting levels: control = 0, case = 1
Setting direction: controls < cases
当我将预测值设置为概率时,会给我以下错误:
> roc(pred[,2],as.numeric(data$target))
'response' has more than two levels. Consider setting 'levels'
explicitly or using 'multiclass.roc' insteadSetting levels:
control = 0.166666666666667, case = 0.232876712328767
Setting direction: controls < cases
因此,我对于应该将预测设置为哪种格式感到困惑,以便正确计算ROC?为什么我的函数显示这些错误?
如果您查看pROC's roc
function documentation,您将看到形式定义具有以下形式:
roc
因此,预测是第二个参数,而不是您使用的第一个参数。因此,您的呼叫应类似于:
## Default S3 method:
roc(response, predictor, [...]
如果忘记了顺序,则可以始终使用命名参数来忽略顺序:
roc(data$target, pred[,2])
还请注意,即使没有必要,甚至也不建议将响应转换为数字矢量,所以我从上面的调用中删除了roc(predictor = pred[,2], response = data$target)
。