I一直试图对R中的一些缺失值进行KNN估算,但它已经在不应该像年龄那样的任何负值的列中引入负值。(年龄确实有缺失的值,但我不想要它被负值推算)。
这是我的代码:
#KNN Imputation:
preProcess_missingdata_model <- preProcess(train, method='knnImpute')
preProcess_missingdata_model
# Use the imputation model to predict the values of missing data points
library(RANN) # required for knnImpute
train <- predict(preProcess_missingdata_model, newdata = train)
我该怎么做才能克服这些负面价值?任何建议都将受到高度赞赏。谢谢。
您可以明确地告诉preProcessing
您想要归档哪些列。这可以按如下方式完成:
preProcess_missingdata_model <- preProcess(train[,c('Embarked', 'Sex')], method='knnImpute')
您甚至可以通过在逗号前添加列表来指定要包含的特定行。