从两个数据框中,有什么方法可以计算 R 中列的唯一值吗?

问题描述 投票:0回答:1

从 tsv 文件中,我有两个表。

例如,

表1:V_one

读取ID V_段
abc IGHV3-18-F(2695)
IGHV3-9-F(2840)

表2:V_two

读取ID V_段
定义 IGHV3-9-F(2714),IGHV3-12-F(2656)
jkl IGHV3-10-F(2666),IGHV3-18-F(2666)

我需要创建另一个表,对于这两个新表的“V_Segment”列中的每个唯一值,我获得每个唯一值出现在 tsv 文件中的“V_Segment”列中的次数。

例如:

V_段
IGHV3-18-F 3
IGHV3-9-F 15
IGHV3-9-F,IGHV3-12-F 4
IGHV3-10-F,IGHV3-18-F 7

我尝试了这段代码:

v1 <- V_one %>%
  group_by(df$V_Segment) %>%
  mutate(Count = n_distinct(df$V_Segment))

但是它不起作用,因为(为此)我需要忽略括号中的信息。

你能帮我吗?

提前谢谢您!

r dataframe count unique unique-values
1个回答
0
投票
library(dplyr)

bind_rows(mget(ls(pattern = "V_"))) %>%  
  count(V_segment)

# A tibble: 4 × 2
  V_segment                             n
  <chr>                             <int>
1 IGHV3-10-F(2666),IGHV3-18-F(2666)     1
2 IGHV3-18-F(2695)                      1
3 IGHV3-9-F(2714),IGHV3-12-F(2656)      1
4 IGHV3-9-F(2840)                       1
© www.soinside.com 2019 - 2024. All rights reserved.