如何将1200万个交互网络分解为子网络

问题描述 投票:1回答:1

我有一个3列列表,表示具有以下结构的网络:

geneA geneB Spearman_Value

这个列表中有1200万个交互。我想找到存在于这个Spearman值相似的大型网络中的子网。我一直在考虑做的是将列表分成许多不同的部分,并使用与计算集群不同的节点处理每个部分。一个问题是节点需要能够看到列表的其他部分以确定他们正在查看的交互是否是某个其他子网络的一部分。起初我以为我应该使用哈希,因为它允许在O(1)时间内进行搜索,但这会导致过度写入键和/或值。我一直在考虑创建一个数据结构,其中每个子网络都是一个链表,并且它们都在一些更大的结构(如哈希)中绑定在一起。我不确定这是否有意义,因为我不知道如何以某种方式使每个密钥以任何有意义的方式识别不同的子网络。

algorithm networking data-structures bigdata
1个回答
0
投票

最后,我们使用wcgna解决了这个问题并在我们的集群上完成了工作:WCGNA

© www.soinside.com 2019 - 2024. All rights reserved.