省略包含NA的特定列的行

问题描述 投票:100回答:6

我想知道如何在数据框中省略NA值,但只在我感兴趣的某些列中。

例如,

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22))

但我只想省略yNA的数据,因此结果应该是

  x  y  z
1 1  0 NA
2 2 10 33

na.omit似乎删除所有行包含任何NA

有人可以帮我解决这个简单的问题吗?

但如果现在我改变了这样的问题:

DF <- data.frame(x = c(1, 2, 3,NA), y = c(1,0, 10, NA), z=c(43,NA, 33, NA))

如果我只想省略x=naz=na,我可以在哪里放置|功能?

r dataframe na
6个回答
67
投票

您可以使用complete.cases函数并将其放入函数中:

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22))

completeFun <- function(data, desiredCols) {
  completeVec <- complete.cases(data[, desiredCols])
  return(data[completeVec, ])
}

completeFun(DF, "y")
#   x  y  z
# 1 1  0 NA
# 2 2 10 33

completeFun(DF, c("y", "z"))
#   x  y  z
# 2 2 10 33

编辑:只返回没有NAs的行

如果你想消除任何列中至少有一个NA的所有行,只需直接使用complete.cases函数:

DF[complete.cases(DF), ]
#   x  y  z
# 2 2 10 33

或者,如果completeFun已经在您的工作流程中根深蒂固;)

completeFun(DF, names(DF))

165
投票

使用is.na

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22))
DF[!is.na(DF$y),]

53
投票

哈德利的tidyr刚刚获得了这个惊人的功能drop_na

library(tidyr)
DF %>% drop_na(y)
  x  y  z
1 1  0 NA
2 2 10 33

27
投票

使用'子集'

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22))
subset(DF, !is.na(y))

4
投票

到现在为止,可以使用:

na.omit(data, cols = c("x", "z"))

3
投票

试试这个:

cc=is.na(DF$y)
m=which(cc==c("TRUE"))
DF=DF[-m,]

0
投票

如果两个特定列中的任何一个包含<NA>,则省略行。

DF[!is.na(DF$x)&!is.na(DF$z),]

0
投票

试试这个:

DF %>% t %>% na.omit %>% t
© www.soinside.com 2019 - 2024. All rights reserved.