R - 由行连接的所有列串的配对组合。

问题描述 投票:0回答:1

我怎么能把这样的数据框。

  X__1  X__2  X__3 
  <chr> <chr> <chr>
1 a     b     c    
2 d     e     f    
3 g     h     i    
4 j     k     l  

变成这个。

  X__1  X__2  X__3 
  <chr> <chr> <chr>
1 a-d   b-e   c-f  
2 a-g   b-h   c-i  
3 a-j   b-k   c-l  
4 d-g   e-h   f-i  
5 d-j   e-k   f-l  
6 g-j   h-k   i-l 

换句话说,它应该将数据框中所有可能的行进行配对组合,将同一列中的字符串进行组合,但用符号(-)分开。它不需要以其他字母的顺序重复已经做出的组合,即 "a-d, b-e, c-f "是必须的,但 "d-a, e-b, f-c "不是。

先谢谢你。如果需要,请告诉我如何改进提出问题。

r combinations rows
1个回答
3
投票

我们可以用 map

library(purrr)
library(stringr)
map_dfc(df1, combn, m = 2, FUN = str_c, collapse="-")
# A tibble: 6 x 3
#  X__1  X__2  X__3 
#  <chr> <chr> <chr>
#1 a-d   b-e   c-f  
#2 a-g   b-h   c-i  
#3 a-j   b-k   c-l  
#4 d-g   e-h   f-i  
#5 d-j   e-k   f-l  
#6 g-j   h-k   i-l  

或使用 summarise/unnest

library(dplyr)
library(tidyr)
df1 %>%
    summarise(across(everything(), ~ 
        list(combn(., 2, FUN = str_c, collapse="-")))) %>%
    unnest(everything())
# A tibble: 6 x 3
#  X__1  X__2  X__3 
#  <chr> <chr> <chr>
#1 a-d   b-e   c-f  
#2 a-g   b-h   c-i  
#3 a-j   b-k   c-l  
#4 d-g   e-h   f-i  
#5 d-j   e-k   f-l  
#6 g-j   h-k   i-l  

或与 base R

data.frame(lapply(df1, combn, m = 2, paste, collapse="-"))
#   X__1 X__2 X__3
#1  a-d  b-e  c-f
#2  a-g  b-h  c-i
#3  a-j  b-k  c-l
#4  d-g  e-h  f-i
#5  d-j  e-k  f-l
#6  g-j  h-k  i-l

资料

df1 <- structure(list(X__1 = c("a", "d", "g", "j"), X__2 = c("b", "e", 
"h", "k"), X__3 = c("c", "f", "i", "l")), class = "data.frame", row.names = c("1", 
"2", "3", "4"))
© www.soinside.com 2019 - 2024. All rights reserved.