如何根据另一个向量的值对一个向量进行排序

问题描述 投票:0回答:8

我有一个向量 x,我想根据向量 y 中的值的顺序对其进行排序。两个向量的长度不同。

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

预期结果是:

[1] 4 4 4 2 2 1 3 3 3
sorting r
8个回答
226
投票

这个怎么样

x[order(match(x,y))]

6
投票

您可以将

x
转换为有序因子:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

显然,将数字更改为因子可以从根本上改变下游代码对

x
的反应方式。但由于您没有向我们提供有关接下来发生的情况的任何背景信息,因此我想我会建议将此作为一种选择。


2
投票

怎么样?:

rep(y,table(x)[as.character(y)])

(伊恩的可能更好)


2
投票

如果您需要在“y”上订购,无论它是数字还是字符:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

步骤:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1
投票

[编辑:显然伊恩有正确的方法,但我会将其留给后代。]

您可以通过在 y 向量上建立索引来实现这一点,而无需循环。将递增的数值添加到 y 并合并它们:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
投票
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

z 中的结果: 4 4 4 2 2 1 3 3 3

重要步骤:

  1. for(i in y) -- 循环感兴趣的元素。

  2. z<- c(z, ...) -- Concatenates each subexpression in turn

  3. rep(i, sum(x==i)) -- 重复 i(当前感兴趣的元素) sum(x==i) 次(我们在 x 中找到 i 的次数)。


0
投票

您也可以使用

sqldf
并通过
join
中的
sql
函数来完成此操作,如下所示:

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]

0
投票

您还可以使用

{collapse}
包中的快速匹配来获得类似于上面 Yorgos 的答案。

x[order(collapse::fmatch(x,y))]
© www.soinside.com 2019 - 2024. All rights reserved.