我有一个包含 450 个观测值和变量“日期”、“年份”、“站点”、“数字”的数据集。我想选择每个地点和年份数量最多的观测值,然后选择该观测值之前和之后的数字。
df <- data.frame(
year = c(rep(2029, 10), rep(2020, 10), rep(2021, 10)),
date = c(seq(as.Date("2029-01-01"), as.Date("2029-01-10"), by = "day"),
seq(as.Date("2020-01-01"), as.Date("2020-01-10"), by = "day"),
seq(as.Date("2021-01-01"), as.Date("2021-01-10"), by = "day")),
site = rep(c("Site A", "Site B", "Site C"), each = 10, times = 3),
number = sample(1:100, 30, replace = TRUE))
我已经使用
dplyr::group_by(site,year) %>% slice_max(n=1, number)
选择每个站点和年份的最高数量,但我被困在这之后。
谢谢!