从 tsv 文件中,我有两个表。
例如,
表1:V_one
读取ID | V_段 |
---|---|
abc | IGHV3-18-F(2695) |
吉 | IGHV3-9-F(2840) |
和
表2:V_two
读取ID | V_段 |
---|---|
定义 | IGHV3-9-F(2714),IGHV3-12-F(2656) |
jkl | IGHV3-10-F(2666),IGHV3-18-F(2666) |
我需要创建另一个表,对于这两个新表的“V_Segment”列中的每个唯一值,我获得每个唯一值出现在 tsv 文件中的“V_Segment”列中的次数。
例如:
V_段 | 数 |
---|---|
IGHV3-18-F | 3 |
IGHV3-9-F | 15 |
IGHV3-9-F,IGHV3-12-F | 4 |
IGHV3-10-F,IGHV3-18-F | 7 |
我尝试了这段代码:
v1 <- V_one %>%
group_by(df$V_Segment) %>%
mutate(Count = n_distinct(df$V_Segment))
但是它不起作用,因为(为此)我需要忽略括号中的信息。
你能帮我吗?
提前谢谢您!
library(dplyr)
bind_rows(mget(ls(pattern = "V_"))) %>%
count(V_segment)
# A tibble: 4 × 2
V_segment n
<chr> <int>
1 IGHV3-10-F(2666),IGHV3-18-F(2666) 1
2 IGHV3-18-F(2695) 1
3 IGHV3-9-F(2714),IGHV3-12-F(2656) 1
4 IGHV3-9-F(2840) 1