例如,我要删除大于3SD的离群值,但我的数据集中有NA。我想计算SD,删除那些在计算中带有NA的离群值,但保留最终输出中带有NA的那些离群值。似乎使用na.rm函数会删除生成的最终数据帧中的NA,所以我想知道是否还有另一种方法可以解决此问题?我当前拥有的代码是:
df_final = df %>%
filter(height < mean(height, na.rm = T) + (3*sd(df$height, na.rm=T)))
谢谢!
例如,我要删除大于3SD的离群值,但我的数据集中有NA。我想计算SD,删除那些在计算中忽略NA的异常值,但保留...
|
设为is.na
条件,以不删除NA
行