我的数据集中每个人都有两列出生日期(在数据框中)。我希望R计算两列中的值不相同的时间。这意味着计算两个出生日期列不同的人数。
[我试图创建一个循环以在1 =不相等的出生日期时获得向量(其长度=数据集中的人数)。
x=rep(0,4092)
for (i in length(x)){
if(mydata$datebirth1[i]== (mydata$datebirth2[i]){x[i]=FALSE}
else{x[i]=TRUE}
}
x
请注意,我在2列中有一些NA值
首先,您创建一个新的1和0列,其中1表示两个日期不匹配。
df <- transform(df, c= ifelse(a==b, 0, 1))
然后您可以轻松地将sum
应用于您创建的列:
sum(df$c)
为了将来,请考虑提供您到目前为止尝试过的解决方案的代码。