过滤每个条件少于4个NA的行

问题描述 投票:0回答:1

我有一个庞大的蛋白质组学数据集,其中包含14个样品(列)和3000+种蛋白质(行)。没有添加有关样本属于两个条件中的哪一个的信息。大约50%的数据是不适用。我想删除每个条件具有4个或更多缺失值的行。我认为使用filter()功能可能是可行的。如何指定列的条件并添加仅指定每个条件具有3个结果的行的代码?很抱歉,如果这是一个非常基本的问题,之前已经有人问过并回答过,但是我无法找到答案。任何帮助将不胜感激。

r filter missing-data
1个回答
0
投票

一种选择是使用rowSums来计算行中缺失值的数量,然后可以使用它来确定要保留的行。

x <- matrix(rnorm(1400), ncol = 14)
x[x < 0] <- NA

x2 <- x[rowSums(is.na(x)) < 4, ]
© www.soinside.com 2019 - 2024. All rights reserved.