我正在使用蛋白质组数据并测试分析软件版本之间的差异。我们想要一个表格,让我们知道蛋白质在什么版本的软件中显示。
下面是我当前拥有的数据表的简化版本:
Version Protein.ID Protein name
1.1 A name 1
1.2 A name 1
1.1 B name 2
1.2 B name 2
我希望我的桌子看起来像这样:
Version Protein.ID Protein name
1.1, 1.2 A name 1
1.1, 1.2 B name 2
我已经在这里和网上寻找了2天,找不到解决方案。
我曾尝试使用传播和汇总,但均无济于事。我要么有大量的列,要么是缺少我想要的信息的单个列。我尝试使用一些基本的R命令(如粘贴),但无法消除重复的值。
我尝试过的例子:
allver.mergeVerID <- spread(allver.ids, Protein.ID, Ver.ID.Porder)
Error: Each row of output must be identified by a unique combination of keys.
Keys are shared for 5311 rows:
我也使用]收到此错误>
allver.mergeVerID <- allver.ids %>% group_by(Protein.ID) %>% summarise(Ver.ID.Porder= toString(Ver.ID.Porder), )
OR
allver.mergeVerID <- aggregate(Ver.ID.Porder ~ Protein.ID, allver.ids, toString)
此错误是什么意思?
我正在使用蛋白质组数据并测试分析软件版本之间的差异。我们希望有一个表格,让我们知道蛋白质在哪个版本中……
这里是一种方法。通过'Protein.ID'分组后,通过summarise
将元素组合在一起paste
'版本'