我正在尝试按照指南学习如何在 R 中使用机器学习。 我在网上使用了一个样本数据集,它可能有缺失值。
这就是我用来拆分数据的方法:
validation_index <- createDataPartition(Test$Quantity, p=0.80, list=FALSE, times = 1, "na.rm=TRUE")
我收到这个错误:
quantile.default(y, probs = seq(0, 1, length = groups)) 错误:如果 'na.rm' 为 FALSE,则不允许缺失值和 NaN
我试着包括
na.rm=TRUE
在我的代码行中,但它并没有解决错误的问题。
我也尝试过使用
complete.cases(Test)
对于缺失值,但它似乎没有帮助。
我是 R 的新手,环顾四周以找到答案,但到目前为止还没有找到答案,但也许我没有正确理解它。你知道如何解决这个错误吗?
我通过将响应(因)变量从整数转换为因子来修复此错误,例如
Test$Quantity <- as.factor(Test$Quantity)
在尝试分区之前。