我有一个数据框架,其中的问题按逻辑堆叠。使用 R 程序,考虑到这些逻辑,我如何循环查找丢失的数据
例如 我的数据框如下所示:
在这里,我想区分真正的 NA,因为这个问题不适用于他们(如果他们参加足球以外的任何运动)和缺少数据的 NA。 IE。第二条(突出显示)- 参与者踢足球,但没有回答每周踢多少次。我如何在 R 上编码?
您可以简单地创建一个新变量来区分两种类型的缺失值。
library(tidyverse)
df %>%
mutate(missing_type = case_when(is.na(times) & sport == "soccer" ~ "missing",
is.na(times) & sport != "soccer" ~ "N/A",
TRUE ~ "not_missing"))