我下面有一个示例数据框。我需要按类型,种类和BdFt对其进行排序。下面的示例几乎是正确的,但是我不希望物种按字母顺序排序。我想根据每个物种的总和(在每个“类型”之内)以降序对物种进行排序。因此,例如,在类型4404中,“ DF”应首先出现。我也想保持当前的观察数,所以我不想按物种组进行合并。有人可以用dplyr帮助我实现这一目标吗?
-布兰登
Type Species BdFt
4404 BB 164
4404 BB 55
4404 BM 831
4404 BM 419
4404 BM 242
4404 BM 20
4404 CH 565
4404 CH 206
4404 CH 88
4404 CO 1817
4404 CO 531
4404 CO 286
4404 CO 31
4404 DF 19740
4404 DF 5930
4404 DF 613
4404 DF 468
4404 DF 167
4404 GF 360
4404 GF 232
4404 GF 124
4410 BM 909
4410 CH 161
4410 DF 18756
4410 GF 3642
4410 RA 549
这里是arrange
的一个选项
library(dplyr)
df2 <- df1 %>%
arrange(Type, desc(ave(BdFt, Species, Type, FUN = sum)))
df2
# Type Species BdFt
#1 4404 DF 19740
#2 4404 DF 5930
#3 4404 DF 613
#4 4404 DF 468
#5 4404 DF 167
#6 4404 CO 1817
#7 4404 CO 531
#8 4404 CO 286
#9 4404 CO 31
#10 4404 BM 831
#11 4404 BM 419
#12 4404 BM 242
#13 4404 BM 20
#14 4404 CH 565
#15 4404 CH 206
#16 4404 CH 88
#17 4404 GF 360
#18 4404 GF 232
#19 4404 GF 124
#20 4404 BB 164
#21 4404 BB 55
#22 4410 DF 18756
#23 4410 GF 3642
#24 4410 BM 909
#25 4410 RA 549
#26 4410 CH 161
或使用order
中的base R
df1[with(df1, order(Type, -ave(BdFt, Species, Type, FUN = sum))),]
df1 <- structure(list(Type = c(4404L, 4404L, 4404L, 4404L, 4404L, 4404L,
4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L,
4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4410L, 4410L, 4410L,
4410L, 4410L), Species = c("BB", "BB", "BM", "BM", "BM", "BM",
"CH", "CH", "CH", "CO", "CO", "CO", "CO", "DF", "DF", "DF", "DF",
"DF", "GF", "GF", "GF", "BM", "CH", "DF", "GF", "RA"), BdFt = c(164L,
55L, 831L, 419L, 242L, 20L, 565L, 206L, 88L, 1817L, 531L, 286L,
31L, 19740L, 5930L, 613L, 468L, 167L, 360L, 232L, 124L, 909L,
161L, 18756L, 3642L, 549L)), class = "data.frame", row.names = c(NA,
-26L))
[一种替代方法,尽管不如akrun的回答那么简洁。
library(dplyr)
library(tidyr)
dat %>%
group_by(Type, Species) %>%
summarize(SumBdFt = sum(BdFt)) %>%
ungroup() %>%
full_join(dat, by = c("Type", "Species")) %>%
arrange(Type, desc(SumBdFt), BdFt) %>%
select(-SumBdFt)
# # A tibble: 26 x 3
# Type Species BdFt
# <int> <fct> <int>
# 1 4404 DF 167
# 2 4404 DF 468
# 3 4404 DF 613
# 4 4404 DF 5930
# 5 4404 DF 19740
# 6 4404 CO 31
# 7 4404 CO 286
# 8 4404 CO 531
# 9 4404 CO 1817
# 10 4404 BM 20
# # ... with 16 more rows
数据
dat <- read.table(header=TRUE, text="
Type Species BdFt
4404 BB 164
4404 BB 55
4404 BM 831
4404 BM 419
4404 BM 242
4404 BM 20
4404 CH 565
4404 CH 206
4404 CH 88
4404 CO 1817
4404 CO 531
4404 CO 286
4404 CO 31
4404 DF 19740
4404 DF 5930
4404 DF 613
4404 DF 468
4404 DF 167
4404 GF 360
4404 GF 232
4404 GF 124
4410 BM 909
4410 CH 161
4410 DF 18756
4410 GF 3642
4410 RA 549")
((知道ave
实际上在做与group_by(...) %>% summarize(...)
相同的事情可能很有帮助。)