R中如何组合频率相同的类别名称?

问题描述 投票:0回答:1
library(stringr)
cat <- c("AA","AA","AA","Ee","Dd","Ee","Bb","Cc","Cc","Cc")
yyy <- table(cat)
# yyy
# AA Bb Cc Dd Ee 
# 3  1  3  1  2 

对于名为

yyy
的表,类别
AA
Cc
具有相同的频率。
Bb
Dd
也是如此。我的意图是为
AA|Cc
AA
起一个类似
Cc
的名称。对于其他类别应用相同的原则,我如何命名并生成下表?谢谢!

# AA|Cc  Ee  Bb|Dd
#  3      2    1
r stringr
1个回答
0
投票

你可以这样做:

library(dplyr)

cat |>
  as.data.frame() |>
  count(cat) |>
  summarise(value = paste(cat, collapse = "|"), .by = n)

# Output:
  n value
1 3 AA|Cc
2 1 Bb|Dd
3 2    Ee
© www.soinside.com 2019 - 2024. All rights reserved.