我有一个包含日期/时间和几列的文本文件。少数列中也有缺失数据(缺失数据由空单元格表示)。我想计算每 10 行的平均值,但涉及一个条件。仅当 10 行的 5% 具有非缺失数据时,才应计算 10 行的平均值。如果不是,则不应计算平均值,并且应在输出文件中将这 10 行的平均值标记为 NA。
我知道使用以下代码计算平均值,但我不确定如何设置 5% 条件。谁能帮帮我。
library(dplyr)
library(tidyr)
library(lubridate)
df <- read.table('D:/Test/Data.txt', header=TRUE, sep = "\t", check.names = FALSE)
mn <- df %>% separate(`Date/Time`, into = c("Date", "Time"), sep = "T")
mnf <- x %>%
as_tibble() %>%
group_by(group = as.integer(gl(n(), 10, n()))) %>%
summarise(across(everything(), ~ mean(.x, na.rm = TRUE)))