仅当某些数据不丢失时如何计算 R 中的平均值?

问题描述 投票:0回答:0

我有一个包含日期/时间和几列的文本文件。少数列中也有缺失数据(缺失数据由空单元格表示)。我想计算每 10 行的平均值,但涉及一个条件。仅当 10 行的 5% 具有非缺失数据时,才应计算 10 行的平均值。如果不是,则不应计算平均值,并且应在输出文件中将这 10 行的平均值标记为 NA。

我知道使用以下代码计算平均值,但我不确定如何设置 5% 条件。谁能帮帮我。

library(dplyr)
library(tidyr)
library(lubridate) 
df <- read.table('D:/Test/Data.txt', header=TRUE, sep = "\t", check.names = FALSE)
mn <- df %>% separate(`Date/Time`, into = c("Date", "Time"), sep = "T")
mnf <- x %>% 
  as_tibble() %>%
  group_by(group = as.integer(gl(n(), 10, n()))) %>%
  summarise(across(everything(), ~ mean(.x, na.rm = TRUE))) 
r if-statement group-by conditional-statements lubridate
© www.soinside.com 2019 - 2024. All rights reserved.