这个问题在这里已有答案:
我目前正在研究之前在R-Studio中使用过的数据集的更新版本。新更新的特点是编码缺失值,而不是将这些单元格留空。
这种编码的问题在于它们是数值,它干扰了我的分析和建模,专门查看年龄值(也是本栏中的数字),使我的模型倾斜。
我正在寻找一种方法来替换R-Studio的数据帧中具有N / A的特定编码为缺失的值(例如,缺失值的代码是9998)。
也许是这样的事情?
d <- data.frame(x = 1:5,y = letters[1:5],z = c(NA,1:4))
> d$x[3] <- 9998
> d
x y z
1 1 a NA
2 2 b 1
3 9998 c 2
4 4 d 3
5 5 e 4
> d[d == 9998] <- NA
> d
x y z
1 1 a NA
2 2 b 1
3 NA c 2
4 4 d 3
5 5 e 4