我想基于列中的值(字符)对R中的数据帧进行半反向排序。
我有以下示例数据集:
# Sample data
df <- read.table(text="id value
cx-01 1
cx-01 2
cx-02 1
cx-02 2
cx-02 3
cx-03 1
cx-03 2
px-01 1
px-01 2
px-02 1
px-02 2
px-02 3
px-03 1
px-03 2
rx-01 1
rx-01 2
rx-02 1
rx-02 2
rx-02 3
rx-03 1
rx-03 2", header=TRUE)
预期产量:
id value
1 cx-03 2
2 cx-03 1
3 cx-02 3
4 cx-02 2
5 cx-02 1
6 cx-01 2
7 cx-01 1
8 rx-03 2
9 rx-03 1
10 rx-02 3
11 rx-02 2
12 rx-02 1
13 rx-01 2
14 rx-01 1
15 px-03 2
16 px-03 1
17 px-02 3
18 px-02 2
19 px-02 1
20 px-01 2
21 px-01 1
我试图使用基础R的order()
函数,但遗憾的是没有成功。此外,我尝试使用plyr
包的安排功能,但是,我没有按照需要订购数据。
是否可以根据自提供的序列对第一列中的标签进行排序(因此不按字母顺序排列)?
我们可以分别对'id'的数字和字母部分进行arrange
,同时在desc
ending顺序中排列'value'。字母部分似乎是自定义顺序,因此要么使用指定的factor
转换为levels
,要么使用match
和vector
,其顺序与预期的顺序相同,以获得该顺序的索引
library(tidyverse)
df %>%
arrange(match(str_remove(id, "-\\d+"), c("cx", "rx", "px")),
readr::parse_number(as.character(id)), desc(value))
# id value
#1 cx-03 2
#2 cx-03 1
#3 cx-02 3
#4 cx-02 2
#5 cx-02 1
#6 cx-01 2
#7 cx-01 1
#8 rx-03 2
#9 rx-03 1
#10 rx-02 3
#11 rx-02 2
#12 rx-02 1
#13 rx-01 2
#14 rx-01 1
#15 px-03 2
#16 px-03 1
#17 px-02 3
#18 px-02 2
#19 px-02 1
#20 px-01 2
#21 px-01 1
使用来自with()
基地的order()
和R
# sample data
df <- read.table(text="id value
cx-01 1
cx-01 2
cx-02 1
cx-02 2
cx-02 3
cx-03 1
cx-03 2
px-01 1
px-01 2
px-02 1
px-02 2
px-02 3
px-03 1
px-03 2
rx-01 1
rx-01 2
rx-02 1
rx-02 2
rx-02 3
rx-03 1
rx-03 2", header=TRUE, stringsAsFactors=F)
# create another data frame with variables to order on
col.ord <- data.frame(t(sapply(strsplit(df$id, "-"), print)), df$value, stringsAsFactors = F)
# reorder data frame
df[with(col.ord, order(X1, -as.integer(X2), -df.value)), ]
#> id value
#> 7 cx-03 2
#> 6 cx-03 1
#> 5 cx-02 3
#> 4 cx-02 2
#> 3 cx-02 1
#> 2 cx-01 2
#> 1 cx-01 1
#> 14 px-03 2
#> 13 px-03 1
#> 12 px-02 3
#> 11 px-02 2
#> 10 px-02 1
#> 9 px-01 2
#> 8 px-01 1
#> 21 rx-03 2
#> 20 rx-03 1
#> 19 rx-02 3
#> 18 rx-02 2
#> 17 rx-02 1
#> 16 rx-01 2
#> 15 rx-01 1
由reprex package创建于2019-04-27(v0.2.1)