如何在时程分析中计算每个时间点的独特基因?

问题描述 投票:0回答:0

我有时间进程数据,每个时间点(cols)都有一个基因列表(行)。

我需要一种快速的方法来计算每个后续时间点的独特(新颖)基因。

例如,如果我比较时间点3和时间点2,哪些基因在时间点3是新的。然后,对于时间点4,与时间点2和3相比,哪些基因是新的。等等。 我有 14 个时间点和多个数据集,因此需要一种有效的方法来计算每个时间点有多少新基因。

这是数据的一个小样本:

    X1           X2           X3           X4
1   LOC115711925 LOC115694843 LOC115696797 LOC115721738
2   LOC115697141 LOC115695410 LOC115705991 LOC115698757
3   LOC115695663 LOC115695505 LOC115720646 LOC115704937
4   LOC115697811 LOC115695663 LOC115709480 LOC115724472
5   LOC115710226 LOC115695751 LOC115707388 LOC115702544
6   LOC115699430 LOC115695753 LOC115711243 LOC115705803
7   LOC115719329 LOC115695880 LOC115701282 LOC115711243
8   LOC115709251 LOC115695882 LOC115695751 LOC115698778
9   LOC115716776 LOC115695990 LOC115698262 LOC115707330
10  LOC115707556 LOC115696236 LOC115715294 LOC115718803
11  LOC115717016 LOC115696976 LOC115720841 LOC115720837
12  LOC115703186 LOC115696984 LOC115698132 LOC115719149
13  LOC115715930 LOC115696989 LOC115702328 LOC115712227
14  LOC115719149 LOC115697003 LOC115720788 LOC115724518
15  LOC115694843 LOC115697717 LOC115712291 LOC115701008
16  LOC115702383 LOC115697737 LOC115717255 LOC115700185
17  LOC115718171 LOC115697757 LOC115720540 LOC115699220
18  LOC115716727 LOC115697813 LOC115709300 LOC115707967
19  LOC115721947 LOC115697989 LOC115710741 LOC115705222
20  LOC115707802 LOC115698069 LOC115699007 LOC115716814
21  LOC115707848 LOC115698103 LOC115718118 LOC115712507

我曾尝试在excel中手动完成此操作,但过程耗时且容易出现人为错误。 非常感谢您的帮助。

r count unique
© www.soinside.com 2019 - 2024. All rights reserved.