我有一个自2001年以来称为SCWB的数据框。变量YR_IMM捕获每个人的移民年份(=观测)。
1)我想删除“不知道”(= 9998)和“拒绝”(= 9999)观测值。我应该怎么做?我尝试了dplyr软件包,但无法弄清楚如何处理“连续”变量(移民年份从1920到2000)
2)我想将YR_IMM重新编码为“在美国的年限”。该代码正确吗?
YRSinUS
删除(过滤掉)“不知道”和“拒绝”:
library(dplyr)
SCWB %>%
filter(YR_IMM != 9998| YR_IMM != 9999)