我一直在尝试对来自Kaggle的数据进行MICE实验,但是在归类类别变量时遇到了麻烦。我正在研究此笔记本-https://www.kaggle.com/rtatman/animal-bites,并试图预测物种(SpeciesIDDesc)。但是,运行MICE后,NA值均未更改。下面是我现在拥有的代码。
library(tidyverse)
library(lubridate)
library(mice)
#kaggle link with data - https://www.kaggle.com/rtatman/animal-bites
data <- read_csv("Health_AnimalBites.csv",
col_types = list(BreedIDDesc = col_character(),
release_date = col_datetime()))
data_mice_one <- data %>%
filter(!is.na(victim_zip),
!is.na(bite_date),
!is.na(victim_zip),
!is.na(WhereBittenIDDesc)) %>%
mutate(month = month(bite_date, label = TRUE)) %>%
select(SpeciesIDDesc,
victim_zip,
month)
imputed_data_one <- mice(data_mice_one, diagnostics = FALSE, remove_collinear = FALSE, meth="polyreg")
imputed_data_one <- complete(imputed_data_one)
view(imputed_data_one)
sum(is.na(imputed_data_one$SpeciesIDDesc))
运行'imputed_data_one
如何修复我的代码?我使用MICE的方式有误吗?
我刚刚意识到我忘了将SpeciesIDDesc和month转换为因子。该代码现在可用